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文艺 复兴 以 来 ， 源 远 流 长 的 科学 精神 和 逐步 形成 的 学 术 规范 ， 使 西方 国家 在 自然 科学 
的 各 个 领域 取得 了 垄断 性 的 优势 也 正 是 这 样 的 优势 ， 使 美国 在 信息 技术 发 展 的 六 十 多 年 
间 名 家 辈出 、 独 领 风 双 。 在 商业 化 的 进程 中 ， 美 国 的 产业 界 与 教育 界 越 来 越 紧密 地 结合 ， 
计算 机 学 科 中 的 许多 泰山 北斗 同时 身 处 科研 和 教学 的 最 前 线 ， 由 此 而 产生 的 经 典 科 学 著 
作 ， 不 仅 辟 划 了 研究 的 范畴 ， 还 揭示 了 学 术 的 源 变 ， 既 遵循 学 术 规 范 ， 又 自 有 学 者 个 性 ， 
其 价值 并 不 会 因 年 月 的 流逝 而 减退 。 

近年 ， 在 全 球 信息 化 大 潮 的 推动 下 ， 我 国 的 计算 机 产业 发 展 迅猛 ， 对 专业 人 才 的 需求 
日 益 迫 切 。 这 对 计算 机 教育 界 和 出 版 界 都 既是 机 遇 ， 也 是 挑战 ; 而 专业 教材 的 建设 在 教育 
战略 上 显得 举足轻重 。 在 我 国信 息 技 术 发 展 时 间 较 短 的 现状 下 ， 美 国 等 发 达 国 家 在 其 计算 
机 科学 发 展 的 几 十 年 间 积 省 和 发 展 的 经 典 教材 仍 有 许多 值得 借鉴 之 处 。 因 此 ， 引 进 一 批 国 
外 优秀 计算 机 教材 将 对 我 国 计 算 机 教育 事业 的 发 展 起 到 积极 的 推动 作用 ， 也 是 与 世界 接 
轨 、 建 设 真 正 的 世界 一 流 大 学 的 必由之路 。 

机 械 工 业 出 版 社 华章 公司 较 早 意识 到 “出 版 要 为 教育 服务 。 自 1998 年 开始 ， 我 们 就 
将 工作 重点 放 在 了 亲 选 、 移 译 国 外 优秀 教材 上 。 经 过 多 年 的 不 懈 努 力 ， 我 们 与 Pearson, 
McGraw-Hill, Elsevier, MIT, John Wiley & Sons, Cengage 等 世界 著名 出 版 公司 建立 了 良好 
的 合作 关系 ， 从 他 们 现 有 的 数 百 种 教材 中 甄选 出 Andrew S. Tanenbaum, Bjarne Stroustrup, 
Brian W. Kernighan, Dennis Ritchie, Jim Gray, Afred V. Aho, John E. Hopcroft, Jeffrey D. 
Ullman, Abraham Silberschatz, William Stallings, Donald F. Knuth, John L. Hennessy, Larry 
L. Peterson 等 大 师 名 家 的 一 批 经 典 作 品 ， 以 “计算 机 科学 丛书 ”为 总 称 出 版 ， 供 读者 学 
习 、 研 究 及 珍藏 。 大 理 石 纹理 的 封面 ， 也 正体 现 了 这 套 从 书 的 品位 和 格调 。 

“计算 机 科学 丛书 ”的 出 版 工作 得 到 了 国内 外 学 者 的 易 力 相助 ， 国 内 的 专家 不 仅 提供 
了 中 肯 的 选 题 指导 ， 还 不 辞 劳苦 地 担任 了 翻译 和 审 校 的 工作 ; 而 原 书 的 作者 也 相当 关注 其 
作品 在 中 国 的 传播 ， 有 的 还 专门 为 其 书 的 中 译本 作 序 。 迄 今 , “计算 机 科学 丛书 ”已 经 出 
版 了 近 两 百 个 品种 ， 这 些 书 籍 在 读者 中 树立 了 良好 的 口碑 ， 并 被 许多 高 校 采用 为 正式 教材 
和 参考 书籍 。 其 影印 版 “经 典 原版 书库 ”作为 姊妹 篇 也 被 越 来 越 多 实施 双语 教学 的 学 校 所 
采用 。 

权威 的 作者 、 经 典 的 教材 、 一 流 的 译 者 、 严 格 的 审 校 、 精 细 的 编辑 ， 这 些 因素 使 我 们 
的 图 书 有 了 质量 的 保证 。 随 着 计算 机 科学 与 技术 专业 学 科 建 设 的 不 断 完善 和 教材 改革 的 逐 
渐 深 化 ， 教 育 界 对 国外 计算 机 教材 的 需求 和 应 用 都 将 步 和 人 一 个 新 的 阶段 ,我 们 的 目标 是 尽 
善 尽 美 ， 而 反馈 的 意见 正 是 我 们 达到 这 一 终极 目标 的 重要 帮助 。 华 章 公司 欢迎 老师 和 读者 
对 我 们 的 工作 提出 建议 或 给 予 指正 ， 我 们 的 联系 方法 如 下 : 


华章 网 站 ，www. hzbook. com 
电子 邮件 : hzjsj@ hzbook. com 
联系 电话 : (010) 88379604 
联系 地 址 ， 北京 市 西城 区 百 万 庄 南 街 ] 号 华章 教育 


邮政 编码 : 100037 华章 科技 图 书 出 版 中 心 
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“Dally 和 Harting 凭借 在 数字 设计 方面 的 杰出 经 验 ， 以 清晰 和 富有 建设 性 的 方式 将 电 
路 和 体系 结构 设计 融 为 一 体 。 
学 生 通 过 接触 计算 系统 的 不 同 抽象 层次 及 观点 ， 将 发 现 一 条 了 解数 字 设 计 基础 知识 的 
现代 的 、 有 效 的 途径 。 
Giovanni De Micheli ， 瑞 士 洛桑 联邦 理工 学 院 


“Bill 和 Curt 结合 几 十 年 的 学 术 和 行业 经 验 编写 的 这 本 教材 ， 从 非常 实用 的 角度 讲授 数字 
系统 设计 ， 同 时 给 出 了 未 来 工程 师 所 需 的 理论 。 他 们 努力 让 学 生 明 白 正 在 设计 什么 ， 以 及 正在 
构建 什么 。 通 过 介绍 主要 的 高 级 主题 ， 璧 如 综合 、 延 迟 和 逻辑 功效 以 及 同步 ,本 书 在 人 门 级 提 
供 了 不 可 多 得 的 实用 建议 。 这 样 做 ， 即 使 工艺 、 工 具 和 技术 在 未 来 发 生 了 改变 ， 这 本 书 也 将 帮 
助 学 生 做 好 准备 。 

David Black-Schaffer， 瑞 典 乌 普 萨 拉 大 学 


“你 可 以 从 Dally 教授 的 数字 设计 一 书 中 得 到 想 要 的 一 切 。 结 合 几 十 年 的 实践 经 验 ，Dally 教 
授 提 供 了 设计 和 组 成 完整 的 数字 系统 所 必需 的 工具 。 本 书 同时 涵盖 了 基础 知识 和 系统 级 议题 ， 
对 于 未 来 的 微 处 理 器 和 SoC 设计 人 员 来 说 ， 是 一 个 理想 的 起 点 1” 
Robert Mullins, 4|##A FFM BRASS 


“这 本 书 为 如 何 给 本 科 生 讲授 数字 系统 设计 制定 了 一 个 新 的 标准 。 实 用 的 方法 和 具体 的 实 
例 为 任何 想 要 理解 或 设计 现代 复杂 数字 系统 的 人 提供 了 坚实 的 基础 。 
Steve Keckler， 得 克 萨 斯 大 学 奥斯汀 分 校 


“这 本 书 不 仅 介 绍 了 如 何 做 数字 设计 ， 更 重要 的 是 展示 了 如 何 做 “好 的 ”设计 。 它 强调 了 
具有 清晰 接口 的 模块 化 的 重要 性 ， 以 及 生产 出 不 仅 满 足 设 计 规 格 而 且 容 易 被 他 人 理解 的 数字 工 
件 的 重要 性 。 它 使 用 许多 恰当 的 示例 和 Verilog 代码 来 达到 目的 。 

书 中 讨论 了 异步 逻辑 设计 主题 ， 由 于 能 源 消耗 已 经 成 为 数字 系统 中 的 主要 关注 点 ， 这 个 主 
题 可 能 变 得 越 来 越 重 要 。 

本 书 最 后 关于 Verilog 编码 风格 的 附录 特别 有 用 。 这 本 书 不 仅 对 学 生 很 有 价值 ， 而 且 对 该 
领域 的 从 业 人 员 也 很 有 价值 。 我 强烈 推荐 它 。” 

Chuck Thacker, #43234] 
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正如 原 书 作 者 所 言 :“Digital systems are pervasive in modern society. ”我 们 平时 常用 到 
的 图 像 、 音 视频 都 已 经 被 数字 化 ， 就 连 人 的 思维 也 在 被 数字 化 ，AI (Artificial Intelligence, 
人 工 智 能 ) 已 成 为 研究 的 热点 。 

本 书 从 系统 的 视角 介绍 了 数字 系统 设计 的 全 过 程 ， 不 仅 涵 盖 了 组 合 逻辑 电路 、 算 术 运 
算 电路 、 时 序 逻 辑 电路 和 同步 时 序 电 路 等 基本 的 数字 逻辑 课程 的 内 容 ， 还 给 出 了 有 限 状 态 
机 、 流 水 线 、 接 口 规范 、 系 统 时 序 、 存 储 系统 等 计算 机 组 成 原理 课程 的 知识 。William J. 
Dally 不 仅 是 斯 坦 福 大 学 的 教授 ， 还 是 英 伟 达 (NVIDIA) 公司 的 首席 科学 家 。 他 不 仅 具 有 
丰富 的 教学 经 验 ， 还 具有 杰出 的 工程 经 验 。 

在 本 书 的 翻译 过 程 中 ,我 被 书 中 的 内 容 深 深 吸 引 ， 甚 至 到 了 不 可 自拔 的 地 步 。 该 书 与 
国内 同类 教材 有 着 本 质 的 区 别 。 首 先 ， 国 内 教材 大 多 采用 数学 的 方法 讲述 计算 机 ， 而 本 书 
采用 的 是 计算 机 的 方法 讲授 计算 机 。 辟 如， 计算 机 运算 本 就 是 一 个 有 限 字 长 的 运算 ， 整数 
和 小 数 的 位 数 是 约定 的 。 因 此 ， 在 数 制 转换 时 根本 无 须 考虑 整数 部 分 的 “ 除 基 取 余 ” 法 、 
小 数 部 分 的 “ 乘 基 取 整 ” 法 ， 而 采用 权重 法 可 以 轻而易举 地 将 十 进 制 数 转换 成 二 进 制 数 。 
我 在 讲授 这 部 分 时 ， 经 常 问 学 生 的 一 句 话 是 : “你 们 是 喜欢 做 加 减法 ， 还 是 喜欢 做 乘除 
法 ?” 这 是 一 个 将 问题 简单 化 还 是 复杂 化 的 问题 ! 其 次 ， 本 书 在 讲述 数字 系统 设计 流程 时 ， 
给 出 了 国内 教材 很 少 涉及 的 风险 评估 以 及 缓解 这 些 风险 的 方法 ， 还 给 出 了 芯片 和 电路 板 设 
计 中 的 一 些 工 程 方法 。 再 次 ， 本 书 给 出 了 数字 系统 在 实际 工程 中 的 巧妙 应 用 之 法 ， 如 在 减 
色 法 中 利用 原色 的 逻辑 或 ， 可 以 正确 得 到 间 色 和 复 色 。 诸 如 此 类 ， 举 不 胜 举 ! 

正如 微软 的 Chuck Thacker 所 言 :“ 这 本 书 不 仅 介 绍 了 如 何 做 数字 设计 ， 更 重要 的 是 展 
示 了 如 何 做 “好 的 ”设计 。” 我 以 近 20 年 的 计算 机 硬件 和 骨 人 式 系统 教学 、 项 目 开 发 经 验 
以 及 十 几 年 的 企业 产品 研发 经 验 ， 强 烈 推 荐 这 本 教材 ! 

本 书 由 北京 工业 大 学 信息 学 部 计算 机 学 院 的 部 分 教师 翻译 。 其 中 前 言 等 文 前 内 容 和 第 
1、2 章 由 韩 德 强 翻译 ; 第 3 ~7 章 由 邵 温 翻译 ; 第 8、9 章 由 高 雪 园 翻译 ; 第 10 ~13 章 由 
杨 淇 善 翻译 ; 第 14 ~ 19 章 由 张 丽 艳 翻译 ; 第 20 ~25 章 以 及 附录 部 分 由 鲁 觅 程 翻译 ; 第 26 ~ 
29 章 由 王 宗 侠 翻 译 。 全 书 的 审 校 由 韩 德 强 完 成 。 

本 书 在 翻译 过 程 中 得 到 了 机 械 工业 出 版 社 华 章 公 司 朱 动 女 士 的 大 力 支 持 ， 在 此 表示 由 
囊 的 感谢 ! 

限于 译 者 的 水 平 ， 翻 译 中 难免 有 错误 或 不 妥 之 处 ， 真 诚 希望 各 位 读者 批评 指正 。 


韩 德 强 
2017 年 5 月 于 北京 工业 大 学 
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本 书 的 目的 是 教 大 学 生理 解 并 设计 数字 系统 。 书 中 采用 硬件 描述 语言 ( Verilog) 和 现代 
CAD 工具 讲授 当前 工业 数字 系统 设计 所 需 的 技能 ; 特别 关注 系统 级 的 问题 ， 其 中 包括 数字 系 
统 的 分 解 和 划分 、 接 口 设计 和 接口 时 序 ; 涵盖 深入 理解 数字 电路 所 需 的 主题 ， 如 时 序 分 析 、 亚 
稳 态 和 同步 ; 还 涉及 手工 设计 组 合 逻 辑 电路 和 时 序 逻 辑 电 路 的 内 容 。 然 而 ， 对 于 数字 系统 设计 
而 言 ， 除 了 设计 简单 的 模块 之 外 还 有 很 多 内 容 ， 我 们 不 会 详 述 这 些 话题 。 

当 完 成 了 本 书 的 相关 课程 后 ， 学 生 就 应 该 具备 在 企业 中 进行 数字 设计 的 能 力 了 。 尽管 缺乏 
实践 经 验 ， 但 他 们 已 经 掌握 了 数字 设计 实践 中 所 需 的 全 部 工具 。 经 验 会 随 着 时 间 慢 慢 增长 。 

本 书 是 在 作者 25 年 以 上 本 科 生 数字 设计 课程 的 教学 经 验 (加 州 理 工学 院 的 CS181、 麻 省 
理工 学 院 的 6. 004 以 及 斯 坦 福 大 学 的 EE121 和 EE108A) ， 以 及 35 年 设计 数字 系统 的 经 验 ( 贝 
尔 实验 室 、DEC 公司 、Cray Zen], Avici 公司 、Velio 通信 、 流 处 理 器 公司 以 及 NVIDIA 公司 ) 
基础 上 编著 而 成 的 。 结 合 这 两 种 经 验 ， 本 书 将 教 给 学 生 实 际 工作 中 需要 的 有 用 知识 ， 而 所 采用 
的 方法 已 经 被 历届 学 生 证 明 是 有 效 的 。 

我 们 写 这 本 书 的 初衷 是 市 面 上 暂时 找 不 到 任何 一 本 从 系统 级 层面 介绍 数字 设计 的 书 。 绝 大 
部 分 同类 教科 书 讲述 的 都 是 组 合 逻 辑 电路 和 时 序 的 手工 设计 。 虽 然 现 如 今 的 很 多 教科 书 都 采用 
了 硬件 描述 语言 ， 但 绝 大 多 数 采 用 的 都 是 古老 的 TIL 类 型 的 设计 风格 ， 它 只 适用 于 使 用 7400 
四 与 非 门 器 件 的 年 代 (20 世纪 70 年 代 ) ， 无 法 培养 可 以 设计 出 具有 30 亿 晶 体 管 的 CPU 的 学 
生 。 如 今 ， 学 生 需 要 掌握 如 何 分 解 状 态 机 、 划 分 设计 ， 并 构建 正确 时 序 的 接口 。 对 于 这 些 话 
题 ， 我 们 会 采用 一 种 简单 的 方式 介绍 ， 而 不 会 陷 人 细节 。 


本 书 概要 


图 1 所 示 流 程 图 给 出 了 本 书 的 组 织 结 构 及 各 个 章节 的 依赖 关系 。 本 书 分 为 绪论 、5 个 主要 
部 分 以 及 关于 风格 和 验证 的 章节 。 


第 一 部 分 Bit 


第 1 章 介 绍 数字 系统 ， 涵 盖 了 信息 表现 形式 的 数字 信和 号、 噪声 容 限 以 及 数字 逻辑 在 当今 世 
界 中 的 作用 。 第 2 章 介绍 数字 设计 在 工业 中 的 应 用 ,包括 设计 流程 、 现 代 实现 技术 、 计 算 机 畏 
助 设计 工具 和 摩尔 定律 。 


第 二 部 分 ”组合 逻辑 

第 3 ~9 章 论 述 了 组 合 逻 辑 电 路 一 一 输出 值 仅 取 决 于 当前 输入 值 的 数字 电路 。 第 3 童 介绍 
逻辑 设计 的 理论 基础 一 一 布尔 代数 。 第 4 章 介绍 开关 逻辑 和 CMOS 门 电路 。 第 5 章 介绍 用 来 计 
算 CMOS 电路 延迟 和 功 耗 的 简单 模型 。 第 6 章 介绍 利用 基础 门 电路 手工 设计 组 合 电路 的 方法 。 


第 7 章 介绍 利用 Verilog 硬件 描述 语言 对 组 合 逻 辑 的 行为 描述 进行 编码 的 自动 设计 过 程 。 第 8 章 
介绍 组 合 逻辑 基础 单元 、 解 码 器 和 多 路 选择 器 等 。 第 9 章 给 出 了 一 些 组 合 电路 设计 的 实例 。 
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6 组 合 逻 辑 设 计 4CMOS 逻 辑 电 路 


7 使 用 Verilog 、SCMOS 电 路 
描述 组 合 逻 加 的 延迟 和 功 耗 


21 系 统 级 设计 
22 接 口 和 系统 级 时 序 


9 组 合 电路 实例 









算术 电路 





11 和 定点 数 和 浮 点 数 






12 快 速算 术 电 路 


25 存 储 器 系统 


13 算 术 运 算 实 例 


26 异 步 时 序 电路 


20 验 证 与 测试 


28 亚 稳 态 和 同步 失效 


29 同 步 器 设计 


图 1 本 书 的 组 织 结构 及 各 章节 的 相互 关系 





第 三 部 分 算术 电路 


第 10 ~ 13 章 介绍 计数 制 ( 数 制 系统 ) 和 算术 电路 。 第 10 章 介绍 数 的 基本 表示 法 以 及 完成 
整数 的 + 、- 、x 、 二 四 则 运算 的 算术 电路 。 第 11 章 介绍 定点 数 和 浮 点 数 的 表示 方法 及 其 精 
E, 还 包括 对 浮 点 单元 设计 的 讨论 。 第 12 章 介绍 快速 算术 电路 的 构建 方法 ， 包 括 超前 进位 、 
华 莱 士 树 和 布 斯 编码 。 第 13 章 介绍 算术 电路 和 系统 的 实例 。 


第 四 部 分 同步 时 序 逻 辑 


第 14 ~19 章 介绍 同步 时 序 逻 辑 电路 〈 即 状态 仅 在 时 钟 边沿 发 生 改 变 的 时 序 电 路 ) 以 及 有 
限 状 态 机 的 设计 过 程 。 第 14 章 介绍 基础 知识 。 第 15 章 介绍 时 序 约束 。 第 16 章 介绍 的 主题 是 
数据 通路 时 序 电路 的 设计 一 一 其 行为 是 由 一 个 表达 式 而 不 是 一 个 状态 表 进 行 描述 的 。 第 17 章 
描述 如 何 将 复杂 的 状态 机 分 解 成 几 个 更 小 、 更 简单 的 状态 机 。 第 18 章 介绍 存储 程序 控制 的 概 
念 ， 以 及 如 何 利用 微 码 引 擎 建立 有 限 状态 机 。 这 一 部 分 以 第 19 章 的 一 系列 实例 作为 结束 。 


第 五 部 分 ”实用 设计 


第 20 章 和 附录 讨论 了 数字 设计 项 目 中 的 两 个 重要 方面 。 第 20 章 的 主要 内 容 是 验证 逻辑 的 
正确 性 以 及 生产 后 测试 是 否 能 正确 工作 。 附 录 的 内 容 是 教 给 学 生 恰当 的 Verilog 编码 风格 。 这 
种 风格 令 代码 具有 可 读 性 、 可 维护 性 ， 并 使 得 CAD 工具 可 以 产生 优化 的 硬件 。 学 生 应 该 在 编 
写 自 己 的 Verilog 程序 之 前 、 之 中 及 之 后 都 读 一 读 附录 的 内 容 。 


第 六 部 分 ”系统 设计 


第 21 ~25 章 讨论 系统 设计 并 介绍 一 种 数字 系统 设计 和 分 析 的 系统 化 方法 。 第 21 章 介 绍 系 
统 设计 过 程 中 的 6 个 步骤 。 第 22 章 讨论 系统 级 时 序 和 接口 时 序 的 约定 。 第 23 章 讲述 模块 和 系 
统 的 流水 线 ， 还 包括 一 些 流 水 线 的 实例 。 第 24 章 描述 系统 的 互 连 ， 包 括 总 线 、 交 叉 开 关 和 网 
络 等 内 容 。 第 25 章 讨 论 存 储 器 系统 。 


第 七 部 分 “异步 逻辑 


第 26 ~29 章 讨论 异步 时 序 电 路 一 一 无 须 等 待 时 钟 沿 ， 任 何 输入 的 变化 能 即刻 引起 状态 变 
化 的 电路 。 第 26 章 介 绍 流 表 的 分 析 与 综合 以 及 竞争 问题 等 异步 电路 设计 的 基础 知识 。 第 27 章 
给 出 了 上 述 技术 的 实例 ， 分 析 作为 异步 电路 的 触发 顺和 锁 存 器 。 第 28 章 介绍 亚 稳 态 和 同步 失 
效 等 问题 。 第 29 章 是 这 一 部 分 也 是 本 书 的 结尾 ， 讨 论 同步 器 的 设计 一 一 如 何 设计 出 可 以 使 得 
信号 安全 地 跨越 异步 边界 的 电路 。 


本 书 适 用 于 为 期 一 个 季度 (10 周 ) 或 一 个 学 期 (13 周 ) 的 数字 系统 设计 的 入 门 课程 ， 也 
可 以 作为 更 高 级 的 第 二 门 数 字 系统 课程 的 主教 材 。 

使 用 本 书 不 需要 任何 先 修 课 程 ， 只 需要 对 高 中 数学 有 较 好 的 理解 即 可 。 除 了 第 5 章 和 第 28 
章 外 ， 甚 余 章 节 仅 涉及 导数 的 内 容 ， 并 且 不 需要 微 积 分 的 知识 。 在 斯 坦 福 大 学 ， 虽 然 E40 ( 电 
气 工程 导论 ) 是 EE108A (数字 系统 工 ) 的 先 修 课 程 ， 但 是 学 生 即使 没有 学 习 这 门 先 修 课程 ， 
通常 也 可 以 学 习 EE108A。 

对 于 一 个 季度 的 数字 系统 设计 入 门 课程 ， 可 以 涵盖 第 1、3、6、7、8、10、(11) 14, 15, 
16、(17)、21、22、 (23), 26, 28 和 29 章 的 内 容 。 对 于 一 个 季度 的 课程 而 言 ， 可 以 省 去 
CMOS 电路 (第 4 和 5 章 )、 微 码 (第 18 章 ) 和 高 级 系统 (第 24 和 25 章 ) 的 内 容 。 括 号 中 的 
三 章 内 容 是 可 选 的 ， 当 课程 节奏 较为 缓慢 时 可 以 跳 过 这 些 内 容 。 在 斯 坦 福 大 学 开设 这 门 课程 
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时 ， 我 们 通常 会 进行 两 次 考试 : 第 一 次 是 在 讲 完 第 11 章 之 后 ， 第 二 次 则 是 在 讲 完 第 22 章 
之 后 。 

对 于 一 个 学 期 的 数字 系统 设计 入 门 课程 ， 可 以 利用 增加 的 三 周 时 间 讲 解 CMOS 电路 和 一 些 
高 级 系统 的 内 容 。 一 般 而 言 ， 一 个 学 期 的 课程 包含 第 1、2、3、4、 (5)、6、7、8、9、10、 
(11), 13, 14, 15, 16, (17), (18). (19), 21, 22, (23), (24), (25), 26, (27), 28 和 
29 章 的 内 容 。 

本 书 也 可 以 用 于 数字 系统 设计 的 高 级 课程 。 此 类 课程 更 深入 地 介绍 人 门 课 程 的 内 容 ， 同 时 
涵盖 了 入 门 课程 里 略 去 的 高 级 内 容 。 此 类 课程 通常 会 包括 一 个 有 意义 的 学 生 项 目 。 


素材 


为 了 支撑 本 书 的 教学 ， 课程 网 站 提供 了 教学 素材 ?， 包括 讲课 幻灯 片 、 一 系列 实验 和 部 分 
习题 的 答案 。 实 验 则 在 加 强 对 课程 内 容 的 理解 ， 可 通过 软件 仿真 ， 或 是 在 FPGA 上 通过 仿真 和 
实际 操作 相 结 合 的 方式 实现 。 
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Digital Design: A Systems Approach 


数字 抽象 化 





在 当今 社会 中 ， 数 字 系 统 无 处 不 在 。 有 些 采用 数字 技术 比较 明显 ， 辟 如 个 人 计算 机 或 是 网 
络 交换 机 。 另 外 ， 还 有 很 多 其 他 的 数字 技术 方面 的 应 用 。 当 你 使 用 电话 通话 时 ， 绝 大 多 数 情况 
下 你 的 声音 都 经 过 数字 化 处 理 ， 并 通过 数字 通信 设备 进行 传输 。 当 你 聆听 一 个 音频 文件 〈 数 字 
格式 录制 的 音乐 ) 时 ， 也 是 通过 数字 逻辑 加 工 过 的 ， 用 以 纠正 错误 并 提高 音频 质量 。 当 你 观看 
电视 节目 时 ， 图 像 就 是 以 数字 格式 进行 传输 并 由 数字 电子 技术 进行 处 理 的 。 如 果 你 有 一 台 DVR 
(digital video recorder， 数 字 视 频 录 像 机 ) ， 其 实 就 是 在 以 数字 格式 录制 视频 。DVD 就 是 压缩 过 
的 数字 录像 制品 。 当 你 播放 DVD 或 是 观看 流 媒体 时 ， 其 实 就 是 在 对 视频 进行 数字 解压 及 处 理 。 
大 多 数 的 无 线 电 通信 ， 壁 如 手机 和 无 线 网 络 ， 都 是 通过 数字 信号 处 理 以 实现 调制 解 调 的 功能 。 
这 样 的 例子 比比 丝 是 。 

大 多 数 现代 电子 设备 只 在 边缘 位 置 使 用 模拟 电路 ， 即 与 物理 传感器 或 执行 部 件 连接 。 传 感 
器 〈 比 如 麦克 风 ) 的 信号 会 以 最 快 的 速度 转换 成 数字 格式 。 所 有 的 信息 存储 和 传输 的 实际 过 
程 都 是 以 数字 形式 完成 的 。 信 号 仅 在 输出 的 时 候 才 被 转换 回 模拟 形式 ， 以 便 驱 动 执行 部 件 ( 比 
如 扬声器 ) 或 控制 其 他 的 模拟 系统 。 

不 久 以 前 ， 世 界 并 不 是 数字 的 。 在 20 世纪 60 年 代 ， 数 字 逻 辑 仅仅 出 现在 昂贵 的 计算 机 系 
统 和 一 些 特定 的 应 用 中 。 所 有 的 电视 、 收 音 机 、 唱 片 和 电话 采用 的 都 是 模拟 系统 。 

随 着 集成 电路 的 规模 化 ， 数 字 化 成 为 可 能 。 由 于 集成 电路 变 得 越 来 越 复 杂 ， 也 使 得 处 理 更 
为 复杂 的 信号 成 为 可 能 。 诸 如 调制 、 纠 错 和 压缩 等 复杂 的 技术 采用 模拟 技术 是 无 法 实现 的 ， 只 
有 数字 逻辑 才 有 能 力 完 成 无 噪声 积累 的 计算 ， 有 能 力 表 示 任 意 精度 的 信号 ， 并 可 以 实现 这 些 信 
号 的 处 理 算 法 。 

在 本 书 中 ， 我 们 将 会 看 到 在 日 常生 活 中 占有 如 此 大 部 分 的 数字 系统 的 功能 ， 以 及 它们 是 如 
何 设计 的 。 


1.1 数字 信号 


数字 系统 以 数字 形式 存储 、 处 理 和 传输 信息 ， 数 字 信 息 可 以 表示 为 编码 到 一 个 物理 量 范围 
内 的 离散 符号 。 通 常 来 说 ， 我 们 表示 信息 只 用 “0” 和 “1” 两 个 符号 ， 图 1-1 所 示 为 在 电压 范 
围 内 编码 这 两 个 符号 。 在 标记 为 “0” 和 “1” 范 围 内 的 电压 分 别 用 符号 “0” 和 “1” 表 示 。 
在 两 个 范围 之 间 的 电压 ， 即 标记 为 “?” 的 区 域 是 未 定义 的 ， 且 不 表示 为 两 者 之 间 的 任 一 符 
号 。 在 两 个 范围 之 外 的 电压 ， 即 小 于 “0” 或 者 大 于 “1” 的 范围 都 是 不 允许 的 ， 如 果 出 现 了 
这 部 分 电压 ， 就 有 可 能 会 对 系统 造成 永久 性 损坏 。 我 们 称 以 图 1-1 所 示 的 方式 编码 的 信号 为 二 
进 制 信号 ， 因 为 它 具 有 两 个 有 效 的 状态 。 


arj 0 |?| 1 a 
F. Ú Fx. Ya V, Vous 电压 
图 1-1 在 电压 范围 内 两 个 符号 (0 和 1) 的 编码 。 在 标记 为 0 范围 内 的 所 有 电压 均 视 为 符号 0， 
在 标记 为 1 范围 内 的 所 有 电压 均 视 为 符号 1。 在 0 和 1 之 间 ( 即 “?” 范 围 ) 的 电压 未 
定义 ， 不 表示 为 两 者 之 间 任 一 符号 。 在 0 和 1 范围 之 外 的 电压 可 能 会 对 接收 信和 号 的 设 
备 造成 永久 性 损坏 
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表 1-1 所 示 为 在 2.5 V 电源 供电 系统 中 ， 对 二 进 制 数字 信和 号 进行 编码 的 JEDEC JESD8-5 标 
准 [59]。 采 用 这 种 标准 ， 电 压 在 -0.3 V 和 0.7V 之 间 的 任意 信号 均 被 视 为 “0”， 而 电压 在 
1.7 V 和 2.8V 之 间 的 任意 信号 均 被 视 为 “1”。 不 在 这 两 个 范围 内 的 信和 号 未 定义 。 如 果 一 个 信 
号 低 于 -0.3 V 或 者 高 于 2.8 V, 便 可 能 会 造成 损坏 。” 
表 1-1 2.5 V LVCMOS 逻辑 的 二 进 制 信 号 编码 。 电 压 在 [ -0.3, 0.7] 之 间 的 信号 被 视 为 
0, BE [1.7, 2.8] 之 间 的 信号 被 视 为 1。 电 压 在 (0.7, 1.7] 之 间 未 定义 ,而 
电压 在 [ -0.3, 2.8] 之 外 ， 便 可 能 造成 永久 性 损坏 








2 数 值 #F OK 
Foik =DL 32 V 绝对 最 小 电压 ， 低 于 此 值 时 发 生 损 坏 
Vo 0.0 V 表示 逻辑 “0” 的 标 称 电压 
Var, 0.2 V 表示 逻辑 “0” 的 最 大 输出 电压 
Vu, 0.7 V 通过 模块 输入 的 视 为 逻辑 “0” 的 最 大 电压 
Vin 1.7 V 通过 模块 输入 的 视 为 逻辑 “1” 的 最 小 电压 
Vou 2.1V Pen HB “17 的 最 小 输出 电压 
V. 2.5 V 表示 逻辑 “1” 的 标 称 电压 
Vinex 2.8 V 绝对 最 大 电压 ， 高 于 此 值 时 发 生 损 坏 


数字 系统 并 不 局 限于 二 进 制 信号 ， 也 可 以 用 三 个 、 四 个 或 任意 有 限 多 个 离散 值 来 形成 数字 
信和 号。 然而， 它们 与 二 值 相 比 几乎 没有 优势 ， 并 且 采 用 二 值 信号 的 存储 和 运算 电路 比 采 用 两 个 
以 上 值 的 电路 更 为 简单 ， 鲁 棒 性 也 更 强 。 因 此 ， 除 了 少数 的 特定 应 用 外 ， 当 今 的 数字 系统 中 普 
遍 采 用 的 还 是 二 进 制 信号 。 

除 电 压 外 ， 数 字 信 号 也 可 以 编码 其 他 的 物理 量 。 几 乎 所 有 易于 操作 和 感知 的 物理 量 都 可 以 
用 数字 信和 号 表示 ， 采 用 电流 、 气 压 、 液 压 和 物理 位 置 构建 的 系统 可 以 用 数字 信和 号 表示 。 不 管 怎 
样 ， 由 于 低 成 本 CMOS 集成 电路 制造 复杂 系统 的 巨大 能 力 ， 使 得 电压 信号 更 为 通用 。 


1.2 数字 信和 号 容忍 噪声 

数字 系统 无 处 不 在 ， 以 及 它们 有 别 于 模拟 系统 的 主要 原因 在 于 : 它们 可 以 处 理 、 传 输 和 存 
储 信息 ， 而 不 会 因为 噪声 而 失真 。 正 是 数字 信息 的 离散 性 使 之 成 为 可 能 。 一 个 二 进 制 的 信号 可 
以 表示 为 0 或 者 1。 如 果 有 一 个 表示 为 1 的 电压 V,， 让 一 个 很 小 的 噪声 e 对 其 进行 干扰 ， 它 仍 
然 为 1。 即 便 有 外 界 噪声 干扰 ， 信 息 也 不 会 丢失 ， 除 非 噪声 大 到 足以 将 信和 号 推出 1 的 范围 。 大 
多 数 系 统 中 ， 很 容易 将 噪声 控制 在 这 个 值 之 内 。 

图 1-2 中 比较 了 噪声 对 模拟 系统 (图 1-2a) 和 数字 系统 (图 1-2b) 的 影响 。 在 模拟 系统 
中 ， 信 息 由 模拟 电压 了 表示 。 例 如 ， 我 们 也 许 会 依据 关系 了 =0.2 (T-68) 用 电压 来 表示 温度 
(ERE), ， 所 以 72.5 下 的 温度 就 可 以 用 900 my 的 电压 表示 。 这 种 表示 方法 是 连续 的 ， 每 个 电 
压 对 应 着 不 同 的 温度 。 因 此 ， 如 果 我 们 用 一 个 噪声 电压 e 干扰 信号 YY， 得 到 的 结果 了 + 将 表 
示 一 个 不 同 的 温度 。 例 如 ， 如 果 e=100 mV， 新 的 信号 了 +e =1V 将 对 应 着 73 F (T=5 V +68), 
这 就 和 原来 的 温度 72.5 下 不 同 了 。 

在 数字 系统 中 ,信号 的 每 一 位 都 由 电压 表示 ，V 还 是 V, 取决 于 该 位 是 1 还 是 0。 例 如 ， 如 
果 一 个 噪声 源 干 扰 了 数字 1 的 信号 V, WE 1-2b 中 所 示 ， 得 到 的 电压 V, +e 仍然 表示 为 1， 并 
且 对 这 个 有 噪声 的 信号 应 用 函数 与 对 原始 信号 应 用 函数 给 出 的 结果 相同 。 


O Vs 的 实际 规格 为 Yon +0.3， 其 中 Vow 为 供电 电源 电压 ， 允 许 在 2.3 V 和 2.7 V 之 间 变 化 。 





噪声 Sa) 
£ e 
输入 V G4) Vee V+e) 输出 输入 V, © Vite fV) 输出 
a) 模拟 系统 b) 数字 系统 


图 1-2 ”模拟 和 数字 系统 中 噪声 的 影响 。a) 在 模拟 系统 中 ， 当 信号 了 受到 噪声 干扰 时 ,会 导 
致 信号 衰减 为 VY+e。 此 时 对 该 衰减 的 信号 进行 函数 /的 操作 ， 给 出 的 结果 为 1 (V +e), 
这 与 该 信号 没有 受到 噪声 干扰 时 进行 同样 的 操作 所 给 出 的 结果 不 同 。b) 在 数字 系统 
中 ， 将 噪声 e 释 加 到 一 个 表示 为 符号 1 的 信号 V 时， 给 出 的 信号 V, + e 仍 表示 为 符号 
1。 对 信号 V, +e 进行 函数 /操作 与 该 信号 没有 受到 噪声 干扰 时 进行 同样 的 操作 会 给 出 
ERS (V) 


此 外 ， 如 果 72 下 的 温度 由 值 为 010 的 3 位 数字 信和 号 表示 〈 见 图 1-7c) ， 即 使 该 信号 的 所 有 
三 位 都 受到 噪声 干扰 ， 只 要 噪声 不 大 到 足以 将 该 信号 的 任 一 位 推出 有 效 范 围 ， 该 信号 仍然 表示 
72 下 的 温度 。 

为 了 防止 噪声 累积 到 足以 将 数字 信号 推出 1 或 0 的 有 效 范围 的 程度 ， 我 们 会 周期 性 地 恢复 
数字 信号 ， 如 图 1-3 所 示 。 在 对 数字 信号 进行 传输 、 存 储 和 恢复 或 者 运算 后 ， 其 标 称 值 上 (a 
是 0 或 1) 可 能 会 受到 某 个 噪声 e, 的 干扰 。 如 果 不 进 行 恢复 (图 1-3a) ， 在 每 次 操作 后 噪声 便 
会 累积 ， 并 最 终 淹没 该 信号 。 为 了 防止 累积 , 我们 在 每 次 操作 后 都 要 恢复 该 信号 。 如 果 其 输入 
位 于 0 的 范围 内 ， 则 恢复 装置 (我 们 称 为 缓冲 器 ) 输出 V,， 如 果 其 输入 位 于 1 的 范围 内 ， 则 输 
出 内。 实际 上 ， 缓 冲 器 将 信号 恢复 为 原始 状态 的 0 或 1， 并 消除 任何 附加 的 噪声 。 


噪声 噪声 噪声 
8, 8; E 
V, Vi + & V,+ & + & V,+ E+ & + 8; 
a) 噪声 累积 
噪声 噪声 噪声 
8, E 6 
V, V+ & V, V, + e; K V. + s, V, 
b) 信号 恢复 


图 1-3 数字 信号 恢复 。a) 如 果 不 进 行 恢 复 ， 信 号 会 累积 噪声 ， 最 终 累积 足够 的 噪声 后 便 会 导 
致 错误 的 发 生 。b) 每 次 操作 之 后 ， 将 信号 恢复 到 其 固有 的 值 ， 就 能 防止 噪声 的 累积 


这 种 在 每 次 操作 之 后 都 能 将 信号 恢复 到 无 噪声 状态 的 能 力 ， 使 得 数字 系统 能 够 完成 复杂 的 
高 精度 处 理 。 由 于 在 每 次 操作 时 噪声 都 会 累积 ， 模 拟 系统 只 能 局 限 在 精度 相对 低 的 信号 上 完成 
少量 的 操作 。 在 大 量 操 作 之 后 ， 信 和 号 会 被 噪声 淹没 。 因 为 所 有 的 电压 都 是 有 效 的 模拟 信号 ， 所 
以 没有 办 法 在 操作 之 间 将 信号 恢复 到 无 噪声 状态 。 模 拟 系统 在 精度 方面 也 有 局 限 性 ， 其 表示 的 
信号 的 精度 总 是 要 低 于 背景 噪声 的 精度 。 数 字 系 统 可 以 完成 数量 不 定 的 操作 ， 只 要 在 每 次 操作 
之 后 恢复 信号 ， 就 不 会 累积 噪声 。 数 字 系统 还 可 以 表示 任意 精度 的 信号 ， 而 不 会 被 噪声 破坏 。” 

实际 上 ， 缓 冲 器 和 其 他 恢复 逻辑 设备 不 能 保证 精确 地 输出 V. sk V, 的 电压 ,供电 电源 、 元 
器 件 参数 和 其 他 因素 的 变化 会 导致 输出 与 这 些 标 称 值 略 有 不 同 。 如 图 1-4b AR, MAREE 


O 当然， 在 获取 高 精度 的 真实 世界 信号 时 会 受 模拟 输入 设备 的 限制 。 
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辑 设备 只 能 保证 其 0(1) 输出 落 入 的 0(1) 范围 比 输入 值 的 0(1) WAER, AIA, ME 
保证 所 有 的 0 信号 小 于 Vo,， 并且 保 证 所 有 的 1 信号 大 于 Von。 为 了 确保 信号 能 够 容忍 一 定量 的 
噪声 ， 我 们 强调 Vo <Va B. Vu < Vous 例如 ， 表 1-1 中 所 示 的 是 针对 2.5 V LVCMOS 的 Vo 和 
Vou 的 值 。 我们 可 以 量化 能 容忍 的 噪声 数量 作为 该 信号 的 嗓 声 容 限 : 
Ya = Vou — Vin 
Vym = Vu, — Vor (1-1) 
虽然 假定 较 大 的 噪声 容 限 将 会 更 好 ， 但 并 不 一 定 是 这 种 情况 。 数 字 系 统 中 的 大 多 数 噪声 都 
是 由 于 信和 号 传递 引起 的 ， 因 此 更 倾向 于 与 信号 摆 幅 成 比例 。 因 此 ， 真 正 重要 的 是 噪声 容 限 与 信 
号 摆 幅 之 比 VwA(V — Vy), ， 而 不 是 噪声 容 限 的 绝对 幅度 。 


图 1-4 输入 和 输出 的 电压 范围 。a) 人 逻辑 模块 的 输入 ,解释 了 如 图 1-1 所 示 的 信号 。b) 逻辑 
模块 的 输出 ， 将 信号 恢复 到 更 窗 的 有 效 电压 范围 
图 1-5 展示 了 逮 辑 模块 的 直流 输入 电压 与 输出 电压 之 间 的 关系 ， 横 轴 表 示 模 块 的 输入 电 
压 ， 纵 轴 表 示 模 块 的 输出 电压 。 为 了 符合 我 们 对 恢复 的 定义 ， 所 有 模块 的 传递 曲线 必须 全 部 位 
于 图 中 的 阴影 区 域内 ， 所 以 在 0 或 1 有 效 范 围 内 的 输入 信号 将 产生 较 罕 的 0 或 1 输出 范围 内 的 
输出 信号 。 非 反 相 〈 正 相 ) 模块 ， 像 图 1-3 所 示 的 缓冲 器 一 样 ， 其 传递 曲线 类 似 于 图 中 的 实 


Va Vu 
输入 电压 
图 1-5 BERRA AMEER. H TEA REE A RA, Vmin S Vin <V R Vin < Va < 
Vs ， 输 出 必须 在 有 效 的 输出 范围 Vou < Vu IR Vou SVa Alo BE, HAA Oc ey R 
须 在 阴影 区 域内 。 这 就 要 求 模块 在 无 效 输入 区 域内 的 增益 大 于 1。 实 线 展 示 了 非 反 相 
( 正 相 ) 模块 的 典型 传递 函数 ， 虚 线 展示 了 反 相 模块 的 典型 传递 函数 








EE 
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线 。 反 相模 块 的 传递 曲线 则 与 图 中 虚线 相似 。 无 论 哪 种 情况 ， 实 现 恢复 逻辑 模块 都 需要 有 增 
益 。 信 号 的 最 大 斜率 的 绝对 值 由 下 式 决 定 : 
dV 


oat Von N Vo 


dV,, Ve — Vi 
从 这 一 点 我 们 可 以 得 出 结论 ， 恢 复 逻 辑 模块 必须 是 能 够 提供 增益 的 有 源 元 件 。 
例 1-1 噪声 容忍 

图 1-6 举例 说 明了 骂 声 模型 中 的 噪声 (由 两 个 电压 源 模 仿 ) 可 以 使 缓冲 器 输出 端的 电压 内 
在 正方 向 最 大 偏 移 0.5V， 在 负 方 向 最 大 偏 移 0.4 V。 也 就 是 说 ， 滞 加 的 噪声 电压 Ve [ -0.4, 
0.5] 。 对 于 输出 电压 内 ， 在 下 一 个 缓冲 器 的 输入 端 上 的 电压 为 内 + 及 E [V,-0.4, V, +05]. 
利用 这 个 噪声 模型 以 及 表 1-1 中 的 输入 和 损坏 的 约束 ， 便 可 以 计算 出 低 电 平和 高 电 平 输出 的 合 
理 值 的 范围 。 


(1-2) 


max 











s F + 0.5 V F; V.- 0.4 V F; 


图 1-6 例 1-1 的 噪声 模型 


在 计算 输出 电压 时 ， 必 须 满足 4 个 约束 条 件 。 低 电 平 输出 ( Vol) 必须 给 出 一 个 检测 为 低 
电 平 (Vor+ WV, 万 Vi)， 且 不 会 损坏 芯片 《Vor+V 宇 Vs,) 的 输出 电压 ; 高 电 平 电压 (Vo) 不 
能 损坏 芯片 (Vou + VV )， 且 必须 检测 为 高 电 平 (Von +V, 宇 Vin)。 故 有 : 

Vz - 0.4 V>- 03 V 
Wi + 0.5 V 0. 7 V 

0.1 V< Va. < 0.2 V 
Vou = 0.4 VZ 1.7 V 
Va +0.5 V< 2.8 V 

2.1 V< W I = 2.3 V 

每 个 缓冲 器 的 输出 电压 必须 在 0.1V 和 0.2V 之 间 代 表 “0”, 在 2.1V 和 2.3V 之 间 代 表 
“1”。 尽 管 与 这 种 噪声 模型 不 一 致 ， 但 几乎 所 有 电路 都 以 额定 输出 电压 0V AV, (BR) + 
示 0 和 1。 


1.3 数字 信号 表示 复杂 数据 

自然 界 中 的 一 些 信息 本 来 就 是 二 态 的 ， 可 以 用 一 个 单独 的 二 进 制 数字 信号 表示 (如 图 1-7a 
所 示 ) 。 真 命题 或 是 声明 都 属于 这 一 类 。 例 如 ， 一 个 单独 的 信号 可 以 表明 门 是 开 着 的 、 灯 是 亮 
着 的 、 安 全 带 是 扣 着 的 或 者 按键 是 按 下 的 。 

按照 惯例 ， 当 电压 为 高 时 ， 我 们 经 常 认为 信号 是 “ 真 "”。 但 并 不 一 定 全 是 这 种 情况 ， 
因为 还 不 能 排除 用 低 电压 表示 上 述 情况 。 在 整 本 书 中 ， 当 使 用 这 种 低 电压 为 真 的 约定 时 ， 
我 们 会 尽量 表述 清楚 。 在 这 种 情况 下 ， 信 号 的 表述 经 常 变 成 相反 的 ， 比 如 “安全 带 是 解 
开 的 ”。 

在 自然 界 中 ,我 们 经 常 要 表示 的 信息 并 不 是 二 态 的 : 一 年 中 的 某 一 天 、 一 张 扑克 牌 的 大 小 
和 花色 、 房 间 里 的 温度 或 者 颜色 等 。 我 们 用 一 组 二 进 制 信号 对 具有 多 于 两 个 自然 状态 的 信息 进 
行 编码 (图 1-7b)。 一 个 包含 有 VN 个 元 素 的 元 素 集合 可 以 用 具有 n =「 log, N1 位 的 信号 表示 。 例 
如 ， 图 1-7b 中 所 示 的 8 种 颜色 可 以 由 三 个 1 位 的 信号 来 表示 ， 即 Color, Color, 和 Color,。 为 了 
方便 起 见 ， 我 们 将 这 组 三 个 信号 视 为 一 个 多 位 信号 Color,,。。 在 电路 图 或 者 原理 图 中 ， 我 们 并 
不 是 为 这 三 个 信号 画 三 条 线 ， 而 是 画 一 条 带 斜 线 的 线 ， 表 明 它 是 一 个 多 位 信号， 斜 线 旁边 的 数 
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字 “3” 则 表明 由 3 位 组 成 

诸如 电压 、 温 度 、 压 力 等 连续 量 ， 通 过 量化 将 它们 编码 成 数字 信号 。 这 将 使 得 问题 简化 为 
只 需 表示 元 素 集合 中 的 一 个 元 素 。 例 如 ,假设 我 们 要 表示 68 下 到 82 下 之 间 的 温度 ， 并 且 足 以 
分 辨 出 精确 到 2 下 的 温度 。 我 们 将 这 个 温度 范围 量化 为 8 个 离散 值 ， 如 图 1-7c 所 示 。 我 们 可 以 
用 二 进 制 权 重信 号 TempA;.o 来 表示 这 个 范围 ， 其 温度 表示 为 : 


T=68+2 > 2 TempA， (1-3) 
或 者 ， 我 们 可 以 用 一 个 7 位 温度 计 编码 信号 TempB,.。 来 表示 这 个 范围 : 
T = 68 + 2 >》 TempB, (1-4) 


很 多 诸如 此 类 的 编码 也 可 以 选择 ， 设 计 人 员 可 以 根据 手头 上 的 任务 选择 一 种 表示 方法 。 一 
些 传感器 〈 如 温度 计 ) 能 自然 地 生成 温度 计 编码 信号 。 在 一 些 应 用 中 ,， 重 要 的 是 相 邻 编码 仅 
在 1 位 上 不 同 。 平时， 可 以 通过 最 小 化 表示 和 集合 中 的 元 素 所 需要 的 位 数 来 降低 成 本 和 复杂 度 。 
在 第 10 章 讨论 数 制 和 算术 运算 时 ， 我 们 将 重新 讨论 连续 量 的 数字 表示 方法 。 


灯 点 亮 门 打开 按键 按 下 
a) 二 进 制 信息 
Bola  — [000] white] [O11 [purple] 
Color, Colorz: [001| red | 
———OMVONV 010| ue | 
oo — — 3 [100 [yellow | 
b) 元 素 的 集合 
[000| 68 | 0000000] 68 | [ 0001111 
0000001| 70 | [0011111 
[110| 80 | 0000011] 72 | [0o111111 | 80 | 
[100[ 74 | 8 0000111 
TempA;.o TempBe:o 
一 
3 Z 
c) 连续 量 


图 1-7 用 数字 信号 表示 信息 。a) 用 1 位 信号 表示 二 值 声明 。b) 多 于 2 个 元 素 的 元 素 集合 由 
一 组 信号 表示 。 在 这 种 情况 下 ，8 种 颜色 中 的 一 种 由 一 个 3 位 信号 Color,,o 表 示 。c) 量 
化 一 个 连续 的 量 ， 如 温度 ， 其 量化 的 值 的 集合 可 用 一 组 信号 进行 编码 。 这 里 ，8 个 温 
度 中 的 一 个 可 以 编码 成 一 个 3 位 信号 TempA,.。， 或 者 编码 成 一 个 7 位 的 温度 计 编 码 
(thermometer-coded) 信号 TempB。.。， 该 编码 每 次 最 多 只 有 1 位 从 0 变 到 1 


1.3.1 表示 一 年 中 的 某 一 天 

假设 我 们 希望 用 一 个 数字 信和 号 来 表示 一 年 中 的 某 一 天 (忽略 半年 的 问题 ) 。 该 信号 对 应 的 
操作 包括 : 确定 下 一 天 ( 即 给 定 今 天 的 表示 ， 计 算 明 天 的 表示 ) ， 检 查 两 天 是 否 在 同一 个 月 ， 
确定 一 天 是 否 在 男 一 天 之 前 ， 以 及 一 天 是 否 是 这 星期 中 特有 的 一 天 。 

一 种 方法 是 用 | log,365 | =9 位 信和 号 来 表示 0 ~364 的 整数 ， 其 中 0 表示 1 月 1 A, 364 表示 
12 月 31 日 。 这 种 表示 方法 是 紧凑 的 (你 不 可 能 做 到 比 9 位 更 少 ) ， 它 使 得 很 容易 确定 一 天 是 
否 在 男 一 天 之 前 。 然 而 ， 它 不 便于 我 们 完成 男 外 两 个 需要 的 操作 。 要 确定 每 天 对 应 的 月 份 需要 
将 信号 与 每 个 月 的 范围 (1 月 为 0~30, 2 月 为 31 ~58 等 ) 进行 比较 。 要 确定 一 星期 中 的 某 一 
天 需要 用 日 期 的 整数 按 模 7 计算 。 


O ”这 种 多 位 信号 的 符号 在 8. 1 节 中 有 更 详细 的 讨论 。 
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出 于 我 们 的 目的 ， 更 好 的 方法 是 将 信号 表示 为 4 位 月 份 字 段 (1 月 =1, 12 月 =12) 和 5 
位 日 期 字段 (1~31， 留 下 0 不 使 用 )。 采 用 这 种 表示 方法 ,例如 7 月 4 日 (美国 独立 日 ) 是 
0111 00100,, #£+ 0111, =7 表示 7 月 ，00100, =4 表示 日 期 。 用 这 种 表示 方法 ,我 们 便 可 以 更 
直接 地 比较 一 天 是 否 在 男 一 天 之 前 ， 还 可 以 通过 比较 高 4 位 来 容易 地 检查 两 天 是 否 在 同一 个 
H. 但是， 用 这 种 表示 方法 来 确定 一 星期 中 的 某 一 天 更 加 困难 。 

为 了 解决 一 星期 中 某 一 天 的 问题 ， 我 们 采用 一 种 元 余 的 表示 方法 ， 它 包括 一 个 4 位 的 月 份 
字段 (1~12) 、 一 个 5 位 的 该 月 中 日 期 的 字段 (1 ~31) 和 一 个 3 位 的 该 星期 中 的 日 期 字段 
(星期 日 =1，…， 星 期 六 =7) 。 采 用 这 种 表示 方法 ,7 月 4 日 (2012 年 的 一 个 星期 三 ) 就 可 以 
表示 成 一 个 12 位 的 二 进 制 数字 0111 00100 100。0111 意思 是 月 份 为 7 或 7 A, 00100 意思 是 该 
月 的 4 A, 100 意思 是 这 星期 的 第 四 天 或 星期 三 。 


1.3.2 表示 减 色 法 


我 们 经 常 选 择 一 种 表示 方式 来 简化 执行 的 操作 。 例 如 ， 假 设 我 们 希望 用 减 色 系统 来 表示 颜 
色 。 在 减 色 系统 中 ,我 们 从 白色 (所 有 颜色 ) 开始 ， 并 使 用 一 个 或 者 多 个 原色 (红色 、 蓝 色 
或 黄色 ) 的 透明 滤 光 片 对 其 进行 滤 色 。 例 如 ， 如 果 我 们 从 白色 开始 ， 然 后 使 用 红色 滤 光 片 ， 得 
到 红色 。 如 果 再 添加 一 个 蓝 色 滤 光 片 ， 会 得 到 紫色 ， 以 此 类 推 。 通 过 用 原色 滤 色 和 白色， 可 以 生 
MAH. He. REAR. 

一 种 合适 的 颜色 表示 方法 如 表 1-2 所 示 。 在 这 种 表示 方法 中 ， 我 们 用 1 位 来 表示 每 种 原 
色 。 如 果 该 位 被 置 位 ， 则 该 原色 的 滤 光 片 已 在 相应 的 位 置 。 我 们 从 表示 为 全 零 的 白色 开始 ， 即 
在 相应 的 位 置 没有 滤 光 片 。 每 种 原色 只 有 1 位 置 位 ， 即 在 相应 的 位 置 仅 有 该 原色 的 滤 光 片 。 橙 
色 、 紫 色 和 绿色 每 种 间 色 都 有 2 位 置 位 ， 因 为 它们 都 是 用 两 个 原色 滤 光 片 产生 的 。 最 后 ， 黑 色 
是 通过 使 用 全 部 的 三 个 滤 光 片 来 生成 的 ， 因 此 3 位 全 部 置 位 。 


表 1-2 颜色 的 3 位 表示 方法 。 该 表 可 以 直接 用 和 白光 或 通过 用 多 种 原色 滤 色白 色光 来 得 到 ， 选 
择 这 种 表示 方法 使 得 混合 两 种 颜色 等 同 于 将 这 些 颜 色 的 表示 一 起 进行 或 操作 








很 容易 看 出 ， 使 用 这 种 表示 方法 ， 将 两 种 颜色 混合 在 一 起 〈 添 加 两 个 滤 光 片 ) 的 操作 等 
同 于 对 两 种 颜色 的 表示 进行 逻辑 或 的 操作 。 例 如 ， 如 果 我 们 用 蓝 色 100 混合 红色 001， 则 将 得 
到 紫色 紫色 101， 即 001 V100=101。° 


1.4 数字 逻辑 函数 

一 且 将 信息 表示 为 数字 信号， 就 用 数字 还 
辑 电路 计算 信号 的 逻辑 函数 。 也 就 是 说 ， 该 逻 
辑 计 算 输 出 端的 数字 信号 ， 它 是 输入 端的 数字 
信号 的 函数 。 

假设 我 们 希望 搭建 一 个 恒温 器 ， 如 果 温 度 ”图 1-8 使 用 比较 器 实现 的 数字 恒温 器 。 如 果 





高 于 设 定 的 极限 值 ， 则 打开 风扇 。 图 1-8 展示 当前 温度 大 于 设 定 温 度 ， 比 较 器 打开 
了 如 何 使 用 一 个 单独 的 比较 器 实现 这 一 点 ， 比 风扇 


O 符号 V 表示 两 个 二 进 制 数 的 逻辑 或 ， 参 见 第 3 章 。 
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较 器 是 一 个 数字 逻辑 块 ， 用 于 比较 两 个 数字 ， 并 输出 一 个 二 进 制 信号 ， 以 表明 其 中 一 个 是 否 大 
于 另 一 个 (我们 将 在 8. 6 节 探 讨 如 何 构建 比较 器 ) 。 比 较 器 用 两 个 温度 作为 输入 : 来 自 温 度 传 
感 锅 的 当前 温度 和 设 定 的 极限 温度 。 如 果 当 前 温度 高 于 极限 温度 ， 比 较 器 的 输出 就 会 变 为 高 电 
平 ， 进 而 打开 风扇 。 数 字 恒 温 器 是 一 个 组 合 远 辑 电路 的 实例 ， 即 逻辑 电路 的 输出 仅 取决 于 其 输 
入 的 当前 状态 。 我 们 将 在 第 6 ~ 13 章 中 学 习 组 合 逻辑 电路 。 


例 1-2 当前 日 期 的 电路 

假设 我 们 希望 用 1.3.1 节 中 所 描述 的 表示 方法 来 构建 一 个 日 历 电 路 ， 其 一 直 输 出 当天 所 在 
的 月 份 、 日 期 、 星 期 。 图 1-9 所 示 的 电路 需要 存储 功能 ， 寄 存 器 存储 当前 日 期 ( 当前 月 份 、 日 
期 和 星期 )， 使 得 当前 日 期 在 寄存 器 输出 端 可 用 ， 并 且 在 时 钟 上 升 沿 到 来 之 前 忽略 寄存 器 的 输 
入 。 当 时 钟 信号 上 升 时 ， 寄 存 器 用 其 输入 端 上 的 值 来 更 新 它 的 内 容 ， 然 后 恢复 它 的 存储 功能 
逻辑 电路 依据 今天 的 值 计算 明天 的 值 ， 电 路 增加 了 这 两 天 (FR, WMA) 的 字段 ， 并 且 如 果 
它们 发 生 溢出 便 会 采取 适当 的 措施 。 我 们 将 在 9.2 节 介绍 这 个 逻辑 电路 的 实现 。 时 钟 信号 每 天 
(在 午夜 ) 上 升 一 次 ， 届 时 寄存 器 能 够 用 明天 的 值 来 更 新 它 的 内 容 。 数 字 日 历 就 是 一 个 时 序 逻 
辑 电路 的 实例 。 它 的 输出 不 仅 取 决 于 当前 的 输入 (时 钟 信号) ， 还 与 内 部 状态 (今天 ) FH, 这 
种 内 部 状态 反映 了 过 去 输入 的 值 。 我 们 将 在 第 14 ~ 19 章 中 学 习 时 序 逻 辑 。 


TodayMonth 


4 
路 TodayDoM 
也 
ite 5 
TodayDoW 











图 1-9 数字 日 历 以 月 份 、 日 期 、 星 期 的 格式 输出 当前 日 期 。 寄 存 器 存储 当天 (OR) 的 值 ， 
逻辑 电路 计算 第 二 天 〈 明 天 ) 的 值 


我 们 经 常 通过 组 合子 系统 来 构建 数字 系统 。 或 者 从 另 一 个 角度 来 看 ， 设 计 一 个 数字 系统 ， 是 
将 其 划分 为 组 合 和 时 序 子 系统 ， 然 后 再 设计 每 个 子 系统 。 举 一 个 非常 简单 的 例子 ， 假 如 我 们 想 要 
修改 恒温 器 ， 使 得 风扇 在 星期 日 不 运行 。 可 以 将 恒温 器 电路 和 日 历 电路 组 合 在 一 起 ， 如 图 1-10 所 
示 。 该 日 历 电路 仅 用 于 输出 星期 几 〈DoW ) ， 这 个 输出 与 常量 Sunday = 1 进行 比较 。 如 果 今 天 
是 星期 天 (TtsSunday) ， 比 较 器 的 输出 为 真 ， 反 相 器 (也 称 为 非 门 ) 来 补充 这 个 值 。 如 果 不 是 
星期 天 ， 反 相 器 的 输出 ( ItsNotSunday) 为 真 。 最 后 ， 与 门将 反 相 器 的 输出 和 恒温 器 的 输出 结 
合 在 一 起 。 仅 当 温度 高 且 不 是 星期 天 时 ， 与 门 的 输出 才 为 真 。 系 统 级 的 设计 〈 某 种 程度 上 要 比 
这 个 简单 实例 的 水 平 高 一 些 ) 是 第 21 ~25 章 的 主题 。 


1.5 数字 电路 和 系统 的 Verilog 描述 


Verilog 是 一 种 用 来 描述 数字 电路 和 系统 的 硬件 描述 语言 (hardware description language, 
HDL), 一旦 用 Verilog 描述 了 系统 ， 就 可 以 使 用 Verilog 仿真 器 来 仿真 它 的 操作 。 我 们 还 可 以 用 





晶 ” 我们 现在 不 回答 如 何 用 正确 的 日 期 初始 化 寄存 器 。 
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图 1-10 通过 将 恒温 器 和 日 历 电路 结合 在 一 起 ， 我 们 实现 了 一 个 当 温 度 高 时 打开 风扇 的 电 
路 ， 星 期 天 除外 ， 星 期 天 风扇 保持 关闭 

综合 程序 (类 似 于 编译 器 ) 来 综合 电路 ， 将 Verilog 描述 转换 成 门 级 描述 ， 进 而 映射 到 标准 单 
元 或 FPGA E. Verilog 和 VHDL 是 当今 广泛 使 用 的 两 种 硬件 描述 语言 。 在 工业 界 ， 大 多 数 芯 片 
和 系统 都 是 通过 用 这 两 种 语言 之 一 编写 描述 来 设计 的 。 

我 们 将 在 本 书 中 使 用 Verilog 来 阐明 原理 ， 并 讲授 Verilog 编码 风格 。 在 使 用 本 书 的 课程 结 
束 时 ， 读 者 应 熟练 读 写 Verilog。 附 录 给 出 了 编写 Verilog 的 风格 指南 。 

恒温 器 示例 的 Verilog 描述 如 图 1-11 所 示 。 人 恒温 器 被 描述 为 一 个 Verilog 模块 ， 其 代码 位 于 
关键 字 module 和 endmodule 之 间 。 第 一 行 声 明了 模块 的 名 称 是 Thermostat ， 其 接口 包含 
三 个 信和 号: presetTemp, currentTemp 和 fanon。 第 二 行 声明 了 两 个 温度 信号 都 是 3 位 的 
输入 信和 号， 其 中 [2:0] 表示 presetTemp 包含 子 信 号 presetTemp [2], presetTemp 
[1] #lpresetTemp [0], currentTemp 与 其 类 似 。 第 三 行 声明 了 fanon 是 一 个 1 位 的 输 
出 信号 。 第 四 行 〈 非 空 行 ) 描述 了 整个 模块 的 功能 ， 它 为 信号 fanon 声明 了 一 个 wire, 4 
currentTemp 大 于 presetTemp 时 ， 将 赋值 wire 为 真 。 当 presetTemp =3 且 current- 
Temp 在 0 到 7 之 间 循 环 时 ， 该 模块 仿真 的 结果 如 图 1-12 所 示 。 


module Thermostat (presetTemp, currentTemp, fanOn) ; 
input [2:0] presetTemp, currentTemp ; // 3 位 输入 i 
output fanOn ; // 1 位 输出 


wire fanOn = (currentTemp > presetTemp) ; // 比较 温度 





endmodule 
Fl 1-11 HH Verilog 描述 恒温 器 的 例子 


乍 一 看 ，Verilog 代码 看 起 来 与 传统 的 编程 语言 如 C 或 Java 很 类 似 。 然 而 ，Verilog 或 任何 其 
他 的 硬件 描述 语言 ， 从 根本 上 不 同 于 编程 语言 。 在 像 C 这 样 的 编程 语言 中 ， 每 次 只 有 一 条 语句 
是 活动 的 。 语 句 是 按 顺序 执行 的 ， 一 次 执行 一 条 语句 。 而 
在 Verilog 中 ， 所 有 的 模块 以 及 每 个 模块 中 所 有 的 赋值 语句 
始终 都 是 活动 的 。 也 就 是 说 ， 所 有 的 语句 自始至终 都 被 
执行 。 

在 编写 Verilog 代码 时 ， 记 住 这 些 代码 最 终 将 被 编译 成 
硬件 是 非常 重要 的 。 每 个 模块 实例 化 后 就 是 向 这 个 设计 添 
加 一 个 硬件 模块 ， 每 个 模块 中 的 每 一 条 赋值 语句 就 是 向 那 
个 模块 的 每 个 实例 添加 门 电路 。 与 门 电路 必须 手工 合成 相 
比 ，Verilog 可 以 成 倍 地 提高 生产 效率 ， 这 样 设计 人 员 可 以 图 1.12 当 presetmem -3 H cur- 


+H + + + HOH + 
ja. y j. FP Q @ S&S ms 





关注 更 高 的 层面 。 同 时 ， 如 果 Verilog 的 抽象 化 使 得 设计 人 rentTemp 从 0 到 7 循环 
员 与 最 终 产品 失去 联系 因而 写 出 一 个 效率 低 的 设计 ， 它 可 Ht, Æ 1-11 中 Verilog 程 


能 也 是 一 个 障碍 。 序 仿真 的 结果 
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1.6 系统 中 的 数字 逻辑 

大 多 数 现代 电子 系统 ， 从 手机 到 电视 再 到 汽车 中 现实 世界 的 信号 
MRA SKA oN OL PE til ae, FL Ul 1-13 所 示 的 形式 。 
这 些 系统 分 为 模拟 前 端 、 一 个 或 多 个 处 理 器 以 及 固定 
功能 数字 浊 辑 块 ， 这 些 部 件 代 表 系 统 的 硬件 。 由 于 模 
拟 电路 会 累积 噪声 并 且 集 成 度 有 限 ， 因 此 我 们 尽 可 能 
少 使 用 它 。 在 现代 系统 中 ， 模 拟 电路 被 限制 在 系统 的 
外 围 接口 ， 主 要 用 于 信号 调理 和 模拟 到 数字 的 转换 ， 
以 及 数字 到 模拟 的 转换 。 

使 用 数字 逻辑 构建 的 可 编程 处 理 吉 完成 复杂 但 计算 
强度 不 高 的 系统 功能 。 处 理 器 本 身 可 能 相当 简单 ， 复 杂 
性 主要 体现 在 处 理 器 运行 的 软件 上 ， 这 些 软件 可 能 包含 
数 百 万 行 代码 。 复 杂 的 用 户 接口 、 系 统 逻 辑 、 要 求 不 高 
的 应 用 以 及 其 他 类 似 的 功能 都 是 由 处 理 器 上 运行 的 软 
件 实现 的 。 然 而 ， 由 于 在 处 理 器 上 实现 某 个 功能 所 需 图 1-13 现代 数字 电子 系统 由 模拟 前 端 、 





的 面 宫 和 能 量 比 在 固定 功能 逻辑 块 中 实现 该 功能 所 需 完成 应 用 中 复杂 但 计算 强度 不 
的 面积 和 能 量 要 高 出 10 ~ 1000 倍 ， 所 以 计算 要 求 最 高 高 部 分 的 一 个 或 多 个 处 理 器 ， 
的 功能 是 直接 在 逻辑 中 实现 的 ， 而 不 是 在 处 理 器 上 运 以 及 完成 应 用 中 计算 密集 部 分 
行 的 软件 中 实现 的 。 的 数字 人 逻辑 块 组 成 


在 一 个 典型 系统 中 ， 阁 依据 操作 的 数量 来 测算 ， 固 定 功 能 逻辑 模块 完成 了 大 多 数 系 统 的 计 
算 , 但 若 依 据 代码 的 行 数 来 测算 ,其 仅 占 系统 复杂 度 的 一 小 部 分 。 固 定 功能 逻辑 用 于 实现 诸如 
无 线 调 制 解 调 器 、 视 频 编 译 码 器 、 加 密 和 解密 功能 以 及 其 他 类 似 的 功能 块 。 对 于 调制 解 调 器 或 
编码 器 而 言 ， 每 秒 完 成 10 ~ 10 次 操作 是 很 常见 的 ， 然 而 在 同样 的 功 耗 下 ， 处 理 器 每 秒 只 能 
完成 10 ~ 10 次 操作 。 如 果 你 在 手机 上 观看 一 个 视频 流 ， 大 多 数 正在 进行 的 操作 都 发 生 在 无 线 
电 调制 解 调 器 中 , 将 RF 波形 译 码 为 符号 ， 视 频 编 译 码 器 再 将 这 些 符 号 译 码 为 像素 。 相 对 而 言 ， 
在 ARM 处 理 器 上 只 进行 少量 的 计算 ， 它 控制 整个 过 程 的 进行 。 

本 书 论 及 数字 逻辑 的 设计 与 分 析 。 图 1-13 的 系统 中 ,在 所 有 的 方块 中 都 可 以 找到 数字 逻 
辑 ， 包 括 将 它们 相连 在 一 起 的 部 分 。 数 字 逮 辑 控制 、 排 序 、 校 准 和 调整 模拟 前 端 中 的 A/D 和 
D/A 转换 器 ;由 数字 逻辑 构建 的 处 理 器 ， 其 功能 通过 软件 定义 ; 数字 逻辑 实现 了 固定 功能 块 ; 
最 后 数字 逻辑 实现 了 总 线 和 网 络 ， 使 得 这 些 方块 可 以 彼此 通信 。 

数字 逻辑 是 构建 现代 电子 系统 的 基础 。 在 你 学 完 这 本 书后 ， 将 对 这 项 技术 有 一 个 基本 的 
理解 。 


小 结 


本 章 概 述 了 数字 设计 。 我们 已 经 看 到 ， 以 数字 形式 表示 信和 号 使 得 它们 能 够 容忍 噪声 。 除 非 
超过 了 骂 声 容 限 ， 否 则 受 品 声 干扰 的 数字 信号 可 以 恢复 到 原始 状态 。 这 使 得 我 们 能 够 完成 复杂 
的 计算 ， 而 不 会 累积 噪声 。 

信息 表示 为 数字 信号 。 例 如 真 命题 “ 门 是 开 着 的 ”只 有 两 个 值 ， 因 此 可 以 直接 用 一 个 数字 信 
号 表示 。 我 们 用 多 位 数字 信和 号 来 表示 集合 中 的 元 素 ， 并 为 集合 中 的 每 个 元 素 分 配 一 个 二 进 制 纺 
码 ， 如 一 周 中 的 星期 几 。 像 导线 上 的 电压 或 者 房间 中 的 温度 等 连续 值 ， 是 通过 首先 量化 该 值 ， 
即将 连续 的 范围 映射 到 有 限 数量 的 离散 步 长 上 ， 然 后 将 这 些 步 长 表示 为 集合 中 的 元 素来 表示 。 

数字 逻辑 电路 执行 逻辑 函数 ， 即 计算 数字 输出 信号 ， 其 值 是 其 他 数字 信号 的 函数 。 组 合 逻 
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辑 电 路 计算 只 是 其 当前 输入 的 函数 的 输出 。 时 序 罗 辑 电路 包括 状态 反馈 ， 并 且 计 算 其 当前 输入 
和 当前 状态 的 函数 的 输出 ， 状 态 可 以 间接 地 认为 是 过 去 的 输入 。 

出 于 仿真 和 综合 的 目的 ， 我 们 以 Verilog 硬件 描述 语言 的 形式 描述 数字 逮 辑 函数 。 可 以 仿 
真 用 Verilog 描述 的 电路 ， 确 定 它 对 测试 输入 的 响应 ， 以 验证 它 的 行为 。 验 证 完 ， 可 以 将 该 
Verilog 描述 综合 到 实际 的 电路 中 去 实现 。 虽 然 Verilog 第 一 眼看 起 来 很 像 一 个 传统 的 编程 语言 ， 
但 它 还 是 完全 不 同 的 。 传 统 的 编程 语言 描述 的 是 一 个 步 进 的 程序 ， 一 次 只 执行 程序 中 的 一 行 ; 
然而 ，Verilog 描述 的 是 硬件 ， 所 有 的 模块 一 直 都 在 同时 执行 。 在 附录 中 给 出 了 Verilog 的 风格 
指南 。 

数字 逮 辑 设计 很 重要 ， 因 为 它 构成 了 现代 电子 系统 的 基础 。 这 些 系 统 由 模拟 前 端 、 一 个 或 
多 个 处 理 器 和 数字 固定 功能 逻辑 组 成 。 数 字 逻 辑 用 于 实现 处 理 器 〈 它 完成 复杂 但 计算 强度 不 高 
的 功能 ) 和 固定 功能 逻辑 〈 它 是 大 部 分 计算 出 现 的 地 方 ) 。 


文献 说 明 


查尔斯 * 巴 贝 奇 (Charles Babbage) 被 认为 设计 了 第 一 台 计 算 的 机 器 : 差分 机 [4]。 他 在 
19 世纪 40 年 代 设 计 的 第 二 代 差 分 机 很 复杂 ， 直 到 2002 年 才 完成 [101 ] 。 他 还 规划 了 一 台 更 为 
复杂 的 分 析 机 ， 其 与 现代 计算 机 有 很 多 相似 之 处 【17]。 其 他 的 机 械 式 计算 器 出 现在 20 世纪 
初 。 美 国法 院 裁定 2 John Atanasoff 于 1940 ~ 1941 年 在 艾 奥 瓦 州 发 明了 第 一 台数 字 计 算 机 。40 
年 后 ，John Atanasoff 在 参考 文献 [3] 中 提 到 了 他 的 发 明 。 

Robert Noyce (传记 [10]) All Jack Kilby 是 集成 电路 的 共同 发 明 人 [86]。 在 离开 仙 童 半 
导体 公司 后 ，Robert Noyce 和 戈 登 ， 摩尔 (Gordon Moore) 共同 创办 了 英特尔 公司 。 在 英特尔 
期 间 ， 摩 尔 观察 了 集成 电路 上 晶体 管 密度 的 增长 ， 这 个 以 指数 增长 的 观察 〈( 即 摩尔 定律 
[81]) 已 经 维持 了 40 多 年 。 

高 级 综合 工具 的 第 一 个 实例 就 是 伯克利 的 BDSyn [96], AX Verilog 语言 的 更 多 信息 ， 请 
参考 本 书后 面 的 章节 、Palnitkar 的 《Verilog HDL) [89] 或 者 关于 该 语言 的 众多 在 线 资 源 。 


习题 

1.1 嗓 声 容 限 ，] 。 假设 有 一 个 使 用 表 1-1 所 述 编码 的 模块 ， 你 可 以 自由 选择 (Vo ,Von) = (0. 3,2. 2) a 
(0.1,2.1)。 你 将 选择 这 些 输出 范围 中 的 哪 一 个 ? 为 什么 ? 

12 嗓 声 容 限 ， 工 。 两 根 导线 在 芯片 上 靠近 放置 ， 它 们 非常 接近 ， 实 际 上 ， 较 大 的 导线 〈 王 扰 源 ) #8 
合 到 了 较 小 的 导线 〈 受 干扰 的 ) ， 并 引起 受 干扰 导线 上 的 电压 发 生 了 变化 。 利 用 表 1-1 中 的 数据 ， 
确定 以 下 问题 。 

(a) 如 果 受 干扰 导线 上 的 电压 是 在 Vo,， 可 以 迫使 它 下 降 而 又 不 会 导致 问题 的 最 大 干扰 源 是 多 少 ? 
(b) 如 果 受 干扰 导线 上 的 电压 是 在 0 V， 可 以 迫使 它 下 降 而 又 不 会 导致 问题 的 最 大 干扰 源 是 多 少 ? 
(e) 如 果 受 干扰 导线 上 的 电压 是 在 fos ， 可 以 迫使 它 下 降 而 又 不 会 导致 问题 的 最 大 干扰 源 是 多 少 ? 
(d) 如 果 受 干扰 导线 上 的 电压 是 在 fp ， 可 以 迫使 它 上升 而 又 不 会 导致 问题 的 最 大 干扰 源 是 多 少 ? 

13 EHRE, 4 和 B 两 个 系统 ,使 用 表 1-1 中 的 编码 来 相互 发 送 逻辑 信号 。 假 设 在 两 个 系统 的 供电 电 
源 之 间 存 在 电压 偏 移 ， 使 得 系统 A 中 的 所 有 电压 都 比 系统 B 高 V,。 系 统 4 中 的 电压 V,， 在 系统 B 
中 呈现 的 电压 为 V. + Ve。 系统 B 中 的 电压 V.， 在 系统 4 PERHEEN V,- Vw。 假设 系统 中 没有 
其 他 的 噪声 源 ，V, 在 什么 范围 内 系统 将 可 以 正常 工作 ? 

1.4 接地 噪声 。 某 个 逻辑 系列 具有 如 表 1-3 所 示 的 信号 电 平 。 我 们 使 用 这 个 逻辑 系列 将 器 件 4 的 输出 端 连 
FXE B 的 输入 端 ， 所 有 信号 的 电 平 都 是 相对 于 本 地 的 地 。 在 发 生 错 误 之 前 ， 两 个 器 件 的 接地 电压 
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1.5 


1.6 


1.7 


1.8 
1.9 


1.10 





(GNDA 和 CNDB) 的 差 值 有 多 大 ? 计算 GNDA 相对 于 CNDB 高 多 少 ， 以 及 GNDA 相对 于 GNDB 低 多 少 。 
表 1-3 习题 1.4 的 电压 等 级 





参 BB fa 2 # 值 
Vor, 0.1 V Vin 0.6 V 
Va 0.4 V Von 0.8 V 


AIB 6 45 5 BP WEA ER 1-4 中 信和 号 电 平 与 它 的 电源 电压 (Vo) 的 比例 关系 对 信号 
进行 编码 。 


表 1-4 习题 1.5 的 电压 等 级 


参 # 值 参 数 值 
Vor 0. 1 Vpop Vin 0. 6Vpp 
Vu. ` 0. 4 Von Von 0. 9 Vno 


假设 两 个 这 样 的 逻辑 器 件 4 和 B 彼此 发 送信 号 ， 且 器 件 4 的 电源 为 Vos =1.0 Vo 假设 没有 其 他 的 
噪声 源 ， 并 且 这 两 个 器 件 具 有 公共 地 ( 即 两 个 器 件 的 0 V 是 同一 个 电 平 ) 设备 BAY A JE 
(Vo) 范围 是 多 少时 ， 系 统 将 在 那个 范围 内 正常 工作 ? 

噪声 容 限 ， 亚 。 采 用 习题 1.5 中 的 比例 方案 ， 若 要 容忍 大 至 100 my 的 噪声 ， 最 低 的 电源 电压 
(V) 是 多 少 ? 

RPS, No KPH ATES Vs 的 信号 电 平 ， 并 与 pm 成 正比 ， 如 表 1-5 所 示 。 我 们 使 用 这 
个 逻辑 系列 连接 两 个 逻辑 器 件 4 和 巨 ， 两 个 器 件 之 间 的 信和 号 在 两 个 方向 上 传输 。 两 个 系统 的 Vo =1 V 
且 系统 4 的 ss =0 V。Vsss 的 取 值 范围 是 多 少时 系统 将 正常 工作 ? 


表 1-5 习题 1.7 的 电压 等 级 








2 数 值 # # 值 
Vor. 0. 9Ves +0. 1 Vpp Vin 0. 3Vs5 +0. TV pp 
Vin 0. 7Vsg +0. 3 Vip Vou 0. 1Vsg +0.9 Vpp 


恢复 设备 的 增益 。 根 据 表 1-1 中 的 值 恢 复 信号 的 电路 的 增益 的 最 小 绝对 值 是 多 少 ? 

格雷 码 。 已 被 量化 为 N 个 状态 的 某 连续 值 可 以 被 编码 为 n =| log, Ni 位 的 信号 ， 其 中 相 邻 状态 最 多 
在 1 位 的 位 置 上 不 同 。 说明 如 何 将 图 1-7c 中 的 8 个 温度 以 这 种 方式 编码 为 3 位 ， 以 确保 你 在 82 °F 
和 68 开间 的 编码 也 仅 在 1 位 的 位 置 上 不 同 。 

编码 规则 。 公 式 (1-3) 和 公式 (1-4) 是 译 码 规则 的 实例 ， 其 返回 值 是 由 多 位 数字 信号 表示 。 请 
写 出 相应 的 编码 规则 。 要 求 这 些 规则 给 出 数字 信号 每 一 位 的 值 ， 该 值 是 被 编码 值 的 函数 。 

编码 扑克 牌 。 建 议 用 二 进 制 表示 扑克 牌 ， 即 用 一 组 二 进 制 信号 唯一 标识 标准 牌 组 中 52 张 牌 中 的 一 
张 牌 。 可 以 使 用 什么 不 同 的 表示 方法 来 : (i) 优化 密度 〈 每 张 牌 的 最 小 位 数 ) 或 (ú) 简化 操作 ， 
例如 确定 两 张 牌 是 否 具 有 相同 的 花色 或 大 小 ? 说 明 你 如 何 使 用 特殊 的 表示 方法 来 检查 两 张 牌 是 否 
相 邻 (大 小 相差 1 ) 。 

星期 几 。 解 释 如 何 从 我 们 在 1. 3. 1 节 讨 论 的 月 份 /日 期 的 表示 方法 中 得 到 这 周 中 的 星期 几 。 

颜色 ， 工 。 给 出 一 个 颜色 的 表示 方法 以 支持 三 原色 组 合 的 加 色 法 的 操作 。 你 从 黑色 开始 ， 然 后 添 
加 红色 、 绿 色 或 蓝 色 的 彩色 光 。 

Re, H. PRIM. 13 的 表示 方法 以 支持 每 个 原色 光 的 三 个 强度 级 别 ， 也 就 是 说 ， 每 种 颜色 光 
可 以 关闭 、 弱 打开 、 中 等 打开 或 强 打开 。 

编码 与 解码 ， 工 。 一 片 排列 成 4 x1 处 理 器 阵列 的 4 核 芯 片 ， 其 中 每 个 处 理 器 都 连接 到 与 其 东 和 西 
相 邻 的 处 理 器 上 ， 阵 列 的 末端 没有 连接 。 处 理 器 地 址 从 最 东边 的 处 理 器 上 的 0 开始 ， 且 每 次 增 1， 
直到 最 西端 的 处 理 器 的 地 址 3。 考 虑 到 当前 处 理 需 的 地 址 和 目的 处 理 器 的 地 址 ， 你 如 何 确定 是 向 
东 还 是 向 西 到 达 目 的 处 理 器 ? 
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1.16 编码 与 解码 ， 工 。 一 片 排列 成 4 x 4 处 理 器 阵列 的 16 核 芯片 ， 其 中 每 个 处 理 器 都 连接 到 与 其 北 、 
南 、 东 、 西 相 邻 的 处 理 器 上 ， 未 端 没 有 连接 。 为 每 个 处 理 器 (0 ~ 15) 的 地 址 选择 一 个 编码 ， 使 得 
当 数据 正在 流 过 处 理 器 时 ， 在 每 个 处 理 器 上 根据 目的 地 址 和 当前 处 理 器 的 地 址 很 容易 ( 即 与 习题 
1. 15 类 似 ) 确定 它 应 当 向 北 、 向 南 、 向 东 还 是 向 西 移动 。 
(a) 画 出 这 个 处 理 器 阵列 ， 并 根据 你 的 编码 用 其 地 址 标注 每 个 核 。 
(b) 描述 如 何 根据 当前 和 目的 地 址 确定 数据 应 该 移动 的 方向 。 
(c) 这 种 编码 或 其 解释 与 从 西北 角 开 始 简单 地 标记 处 理 器 0 ~ 15 有 什么 不 同 ? 
1.17 循环 格雷 码 。 找 出 一 种 将 数字 0 ~5 编码 成 4 位 二 进 制 信号 的 方法 ， 使 得 相 邻 数字 仅 有 1 位 不 同 ， 
L20 | 并 且 还 要 使 得 0 和 5 的 表示 也 仅 有 1 位 不 同 。 
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数字 系统 设计 实践 





在 深入 了 解数 字 系 统 设计 的 技术 细节 之 前 ， 先 从 高 层面 了 解 一 些 当 今 工 业界 中 系统 设计 的 
方法 是 很 有 用 的 。 这 样 ， 我 们 才能 够 把 将 在 后 续 章节 中 学 习 到 的 设计 技术 与 上 下 文 更 好 地 结合 
在 一 起 。 本 章 将 探讨 现代 数字 系统 设计 实践 的 4 个 方面 : 设计 流程 、 实 现 技 术 、 计 算 机 辅助 设 
计 工 具 和 工艺 规模 。 

我 们 将 从 2. 1 节 开 始 讲述 设计 流程 ， 即 设计 如 何 从 设计 规格 开始 ， 并 贯穿 概念 开发 、 可 行 
性 研究 、 详 细 设计 和 验证 等 各 个 阶段 。 除 了 最 后 几 个 步骤 外 ， 大 部 分 的 设计 工作 都 采用 英文 3 
文档 完成 。 任 何 设 计 过 程 的 一 个 关键 方面 是 管理 技术 风险 的 系统 过 程 ， 它 通常 是 定量 的 。 

数字 设计 是 在 超大 规模 集成 (very-large-scale integrated, VLSI) 电路 〈 通 常 称 之 为 芯片 ) 
上 实现 的 ， 并 封装 在 印 制 电路 板 〈printed-eireuit board, PCB) 上 。2. 2 节 中 讨论 了 当代 实现 技 
术 的 能 力 。 

高 度 复杂 的 VLSI 芯片 和 电路 板 的 设计 可 通过 尖端 的 计算 机 辅助 设计 (computer-aided de- 
sign，CAD) 工具 来 实现 。 在 2.3 节 中 介绍 的 这 些 工具 通过 一 系列 相关 工作 来 提高 设计 人 员 的 
以 下 能 力 : 获取 设计 ; 综合 逻辑 和 物理 布局 ; 验证 设计 在 功能 上 是 正确 的 且 满 足 时 序 要 求 。 

大 约 每 两 年 ， 封 装 在 集成 电路 芯片 上 的 最 小 晶体 管 数量 就 会 翻 倍 。 我 们 将 在 2. 4 节 中 讨论 
这 种 称 之 为 摩尔 定律 的 增长 率 ， 及 其 对 数字 系统 设计 的 影响 。 


2.1 设计 流程 
与 其 他 工程 领域 一 样 ， 数 字 设 计 流 程 也 是 从 设计 规格 开始 。 随 后 ， 设 计 依次 经 过 概念 开 
发 、 可 行 性 研究 、 划 分 和 详细 设计 几 个 阶段 。 与 此 相同 ， 大 部 分 课本 只 涉及 这 个 流程 的 最 后 两 


个 步骤。 为 了 客观 地 理解 我 们 将 学 习 到 的 设计 和 分 析 技术 ， 我 们 将 在 这 里 简要 说 明 一 下 其 他 的 
步骤 。 图 2-1 给 出 了 设计 流程 的 概貌 。 


2.1.1 设计 规格 


所 有 的 设计 都 是 从 设计 规格 开始 的 ， 设 计 规 格 描述 了 所 要 设计 的 条 目 。 根 据 对 象 的 新 颖 
性 ， 开 发 设计 规格 本 身 也 许 就 是 一 个 明确 的 或 是 详尽 的 过 程 。 绝 大 多 数 的 设计 都 是 进化 的 ， 即 
现 有 产品 新 版 本 的 设计 。 对 于 这 种 进化 的 设计 ， 设 计 规 格 过 程 就 是 确定 新 产品 优势 所 在 (更 
快 ， 更 小 ， 更 便宜 ， 更 可 靠 等 ) 的 过 程 。 同 时 ， 新 的 设计 常常 受 限 于 原先 的 设计 。 例 如 ， 一 个 
新 型 号 的 处 理 器 通常 必须 能 够 执行 被 其 替代 型 号 相同 的 指令 集 ， 一 个 新 的 [0 设备 通常 必须 支 
持 与 上 一 代 相 同 标准 的 1/0 接口 (例如 PCI 总 线 ) 。 

在 极 少数 情况 下 ， 特 定 的 对 象 是 同类 产品 中 的 第 一 个 。 对 于 这 种 革命 性 的 开发 ， 设 计 规格 
过 程 则 完全 不 同 。 尽 管 新 对 象 可 能 需要 兼容 一 个 或 多 个 标准 ， 但 其 并 没有 向 下 兼容 的 限制 。 虽 
然 这 给 了 设计 人 员 更 多 的 自由 发 挥 的 空间 ,但 同时 又 让 设计 人 员 在 确定 对 象 功能 、 特 点 和 性 能 
时 缺少 指导 。 

无 论 是 革命 性 的 还 是 进化 的 ， 与 大 多 数 工程 过 程 一 样 ， 设 计 规 格 过 程 都 是 一 个 循环 迭代 的 


O ”或 一 些 其 他 的 自然 (人 类 ) 语言 。 
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可 行 性 分 析 





图 2-1 设计 流程 。 初 始 的 工作 重点 是 设计 规格 和 风险 分 析 。 只 有 在 产品 实施 计划 订立 后 ， 才 
进入 产品 实施 阶段 。 实 施 过 程 本 身 具有 许多 验证 和 优化 的 迭代 。 很 多 产品 在 出 货 前 ， 
会 有 多 个 内 部 硬件 版 本 


过 程 。 我 们 首先 为 对 象 撰写 一 个 假想 对 象 (straw man, HEA) 的 设计 规格 ， 在 这 种 情况 下 ， 
我 们 就 可 以 发 现 一 些 问题 (question) 或 是 悬而未决 的 问题 (open issue)。 之 后 ,我 们 可 以 通 
过 收集 信息 来 回答 这 些 问题 或 是 解决 这 些 悬 而 未 决 的 问题 ， 和 迭代 式 地 改进 最 初 的 设计 规格 。 我 
们 与 客户 或 产品 的 最 终 用 户 沟通 来 确定 他 们 想 要 的 产品 特点 、 他 们 对 每 个 产品 特点 重视 的 程度 
以 及 他 们 对 我 们 提议 的 设计 规格 反应 的 程度 。 我 们 通过 工程 研究 来 确定 某 个 产品 特点 的 成 本 。 
成 本 度量 的 示例 包括 达到 一 定性 能 水 平 所 需 的 裸 片 (die) 面积， 或 是 给 处 理 器 添加 一 个 分 支 
预测 器 会 消耗 多 少 功率 等 。 每 次 有 新 信息 出 现时 ， 我 们 都 会 针对 新 信息 修订 我 们 的 设计 规格 。 
这 个 修订 过 程 的 历史 记录 也 会 保留 下 来 ， 以 便 为 这 次 做 出 的 决定 提供 依据 。 

虽然 我 们 可 以 持续 不 断 地 完善 我 们 的 设计 规格 ,但 最 终 我 们 必须 冻结 设计 规格 并 着 手 开始 
设计 。 冻 结 设计 规格 的 决定 通常 是 在 进度 压力 (如果 产 品 上 市 太 晚 ， 便 会 错过 市 场 窗口 ) 和 
所 有 关键 的 悬而未决 问题 的 解决 方案 共同 驱使 下 做 出 的 。 设 计 规 格 被 冻结 并 不 意味 着 它 不 能 再 
变更 。 如 果 在 设计 开始 后 发 现 了 一 个 至 关 重 要 的 缺陷 ， 则 必须 变更 设计 规格 。 然 而 ， 在 冻结 设 
计 规格 之 后 ， 变 更 变 得 更 加 困难 ， 因 为 变更 必须 要 通过 工程 变更 控制 过 程 才能 进行 。 这 是 一 个 
规范 的 工作 流程 ， 可 以 确保 任何 设计 规格 的 变更 都 要 应 用 到 所 有 的 文档 、 设 计 、 测 试 程序 中 ， 
并 且 所 有 受 变 更 影响 的 人 都 需要 在 上 面 签字 。 作 为 变更 决策 过 程 中 的 一 部 分 ， 它 还 要 依据 经 济 
代价 和 进度 延误 两 方面 的 因素 评估 变更 的 成 本 。 

设计 规格 过 程 的 最 终结 果 是 一 个 用 来 描述 设计 对 象 的 英文 文档 。 不 同 的 公司 对 此 文档 使 用 
不 同 的 名 称 ， 许 多 公司 称 之 为 产品 规格 或 (针对 芯片 制造 商 ) 元 器 件 规格 。 一 个 著名 的 微 处 
理 器 制造 商 称 之 为 目标 规格 或 是 TSPEC。? 它 描述 了 对 象 的 功能 、 接 口 、 性 能 、 功 耗 和 成 本 。 
简 而 言 之 ， 它 描述 了 产品 做 什么 ， 但 不 是 它 如 何 做 〈 这 是 设计 要 做 的 ) 。 


O 通常 ,产品 设计 规格 来 自 新 产品 的 商业 计划 ， 它 包括 销售 预测 以 及 估算 新 产品 开发 能 够 带 来 的 投资 回报 。 当 
然 ， 这 是 一 份 单独 的 文档 。 
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2.1.2 概念 开发 与 可 行 性 


在 概念 开发 阶段 进行 系统 的 高 层 设 计 ， 包 括 绘制 框图 、 定 义 主要 的 子 系统 以 及 详细 说 明 系 
统 运行 的 大 致 轮廓 。 更 重要 的 是 ， 在 这 个 阶段 会 做 出 关键 的 工程 决策 ， 这 个 阶段 是 由 设计 规格 
驱动 的 。 概 念 开发 必须 要 符合 设计 规格 ， 如 果 某 个 要 求 难以 达到 ， 则 必须 要 变更 设计 规格 。 

在 划分 以 及 每 个 子 系统 的 设计 规格 期 间 ， 开 发 和 评估 了 设计 的 不 同方 法 。 例 如 ， 构 建 一 个 
大 型 的 通信 交换 机 ， 我 们 可 以 使 用 一 个 大 型 的 交叉 开关 ， 也 可 以 使 用 一 个 多 级 网 络 。 在 概念 开 
发 阶段 ， 我 们 将 评估 这 两 种 方法 ， 并 选择 最 能 满足 我 们 需求 的 方法 。 同 样 ， 我 们 可 能 需要 开发 
一 个 速度 是 先前 型 号 1.5 倍 的 处 理 器 。 在 概念 开发 阶段 ,我 们 会 考虑 提高 时 钟 频率 、 使 用 更 精 
确 的 分 支 预测 器 、 增 加 Cache 容量 和 /或 者 增加 总 线 宽度 ， 我 们 将 孤立 地 和 组 合 地 评估 这 些 方 
法 的 成 本 和 收益 。 I 

工艺 选择 和 供应 商 资 格 亦 是 概念 开发 的 一 部 分 。 在 这 些 过 程 中 ,我 们 将 选择 我 们 使 用 哪些 
元 器 件 和 工艺 流程 来 制造 我 们 的 产品 ， 并 确定 将 由 谁 来 提供 它们 。 在 一 个 典型 的 数字 设计 方案 
中 ， 这 涉及 选择 标准 芯片 〈 像 存储 器 芯片 和 FPCGA) 的 供应 商 、 定 制 芯片 (ASIC 的 供应 商 或 代 
工厂 ) 的 供应 商 、 包 装 供应 商 、 电 路 板 供应 商 和 接 插件 供应 商 。 通 常 ， 需 要 特别 关注 的 是 新 的 
元 器 件 、 工 艺 流程 或 供 货 商 ， 因 为 它们 代表 了 风险 的 一 个 要 素 。 例 如 ， 如 果 我 们 考虑 使 用 一 个 
以 前 从 未 制造 过 或 使 用 过 的 新 型 光 收发 器 或 光 控 开关 ， 我 们 就 需要 评估 它 可 能 不 工作 、 可 能 不 
符合 设计 规格 的 概率 ,或 者 当 我 们 需要 它 时 可 能 无 法 供 货 。 

工艺 选择 的 一 个 关键 部 分 就 是 对 设计 中 的 不 同 部 分 做 出 制作 或 购买 的 决定 。 例 如 ， 你 可 能 
需要 在 是 设计 自己 的 以 太 网 接口 ， 还 是 从 供应 商 处 购买 这 个 接口 的 Verilog 代码 之 间 做 出 选择 。 
依据 成 本 、 进 度 、 性 能 和 风险 评估 两 个 (或 多 个 ) 备 选 方案 ,然后 基于 每 个 优点 做 出 决定 。 
在 做 出 决定 之 前 ， 往 往 需 要 收集 信息 (从 设计 研究 、 提 及 的 供应 商 把 关 等 )。 如 果 自 己 设计 的 
产品 比 从 供应 商 处 购买 的 更 便宜 、 更 快 ， 那 么 工程 师 常 常 喜欢 自己 来 做 这 些 事 。 另 一 方面 ， 
“告诫 买方 〈 一 经 出 售 概 不 负责 )”e 的 情况 也 适用 于 数字 设计 。 有 人 在 销售 一 个 产品 ， 并 不 代 
表 该 产品 能 按 设计 规格 工作 或 符合 设计 规格 。 你 可 能 会 发 现 你 所 购买 的 以 太 网 接口 在 某 些 数 据 
包 长 度 上 不 工作 。 从 外 部 供应 商 处 获得 的 每 项 技术 都 具有 一 定 风险 ， 需 要 在 使 用 前 仔细 验证 。 
与 自己 进行 设计 所 花 的 精力 相 比 ， 这 种 验证 也 是 很 耗费 精力 的 。 

工程 的 一 大 部 分 便 是 管理 技术 风险 的 艺术 ， 即 将 期 望 的 程度 设 定 得 足够 高 以 便 可 以 获得 很 
成 功 的 产品 ， 但 又 不 至 于 高 到 产品 不 能 及 时 制作 出 来 。 一 个 优秀 的 设计 人 员 会 在 选 定 的 高 回报 
领域 中 评估 出 一 些 风险 ， 并 小 心地 应 对 它们 。 过 于 保守 (不 承担 风险 ,或 是 承担 过 少 的 风险 ) 
通常 会 导致 产品 没有 竞争 力 。 另 一 方面 ， 过 于 激进 (承担 太 多 风险 ， 尤 其 在 一 些 回报 很 少 的 领 
域内 ) 则 会 导致 产品 为 时 已 晚 而 失去 时 机 。 目 前 为 止 ， 相 比 于 过 于 保守 而 言 ， 大 部 分 产品 失败 
的 原因 在 于 过 于 激进 (通常 是 在 一 些 无 关 紧 要 的 领域 ) 。 

为 了 有 效 地 管理 技术 风险 ， 一 定 要 识别 、 评 估 和 缓解 风险 。 识 别 风险 是 引起 对 它们 的 注 
意 ， 以 便 可 以 对 它们 进行 监控 。 一 旦 我 们 识别 了 一 个 风险 ,我们 通常 会 在 重要 性 和 危险 性 两 个 
方面 对 其 进行 评估 。 对 于 重要 性 而 言 ， 我 们 会 问 “ 承 担 这 种 风险 的 话 ， 我 们 可 以 从 中 得 到 什 
么 ?” 如 果 它 可 以 让 系统 性 能 加 倍 或 者 降低 一 半 的 功 耗 ， 那 么 它 可 能 值得 一 试 。 但 是 ， 如 果 获 
益 ( 相 比 于 更 保守 的 方案 而 言 ， 可 以 忽略 不 计 ， 那 就 没有 承担 这 种 风险 的 意义 了 。 对 于 危险 
性 而 言 ， 我 们 根据 它们 成 功 的 可 能 性 来 对 风险 进行 量化 、 归 类 。 一 种 方法 是 为 每 一 个 风险 分 配 
两 个 从 1 ~5 之 间 的 数字 ， 一 个 代表 重要 性 ， 一 个 代表 危险 性 。 如 果 风 险 是 (1，5) ， 则 表示 重 
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要 性 低 但 危险 性 高 ， 这 样 便 会 被 放弃 。 如 果 风 险 是 (5，1)， 基 本 上 可 以 确定 是 高 回报 的 情况 ， 
就 可 以 保留 并 进行 应 对 。 如 果 风 险 等 级 是 (5，5) ， 这 意味 着 非常 重要 但 又 非常 人 危险， 是 最 棘 
手 的 。 我 们 承担 不 起 过 多 的 风险 ， 因 此 ， 必 须 放弃 一 些 这 样 的 机 会 。 我 们 降低 风险 危险 性 的 方 
法 是 采用 缓解 的 方法 : 将 风险 由 (5,5) 变 成 (5，4) ， 最 终 变 成 (5，1) 。 

许多 设计 人 员 随 意 地 管理 风险 ， 即 在 心理 上 会 遵循 和 这 里 所 描述 相同 的 过 程 ， 然 而 在 面 对 
哪些 风险 以 及 避免 哪些 风险 上 还 是 会 做 出 本 能 的 决定 。 这 是 一 种 不 良 的 设计 做 法 ， 主 要 原因 有 
以 下 几 点 。 这 种 方式 并 不 适用 于 一 个 大 型 设计 团队 (需要 书面 文件 进行 沟通 ) 或 大 型 设计 
(一 个 人 无 法 全 部 记 下 太 多 的 风险 )。 当 采用 随意 的 、 非 定量 的 风险 管理 方案 时 , 设计 人 员 通 
常会 做 出 不 好 的 且 无 知 的 决策 。 这 些 方案 也 没有 留 下 风险 应 对 决策 背后 的 书面 理由 。 

我 们 常常 通过 收集 信息 的 方式 来 缓解 风险 。 例 如 ， 假 设 我 们 新 设计 的 处 理 器 需要 一 个 单 级 
流水 线 来 检查 依赖 性 、 重 命名 寄存 器 以 及 向 8 个 ALU (一 个 复杂 的 人 逻辑 功能 ) 发 送 指令 。 我 们 
已 经 明确 了 它 的 重要 性 ( 它 极 大 提升 了 性 能 ) 以 及 危险 性 (我 们 不 确定 它 是 否 能 在 我 们 的 目 
标 时 钟 频率 下 运行 )。 我 们 通过 尽早 开始 进行 设计 以 及 确定 它 是 可 以 做 的 (可 行 的) 可 将 风险 
降低 至 1 的 水 平 。 确 定 建议 的 设计 方法 在 实际 中 是 可 行 的 ， 通 常 称 为 可 行 性 研究 。 通 常 ， 确 定 
可 行 性 (达到 高 程度 的 可 能 性 ) 与 完成 一 个 详细 设计 相 比 ， 需 要 付出 的 努力 要 少 得 多 。 

风险 还 可 以 通过 制定 备 选 计划 来 缓解 。 例 如 ， 假 设 我 们 在 概念 设计 中 ，(5，5) 风险 之 一 
是 采用 了 由 小 制造 商 制造 的 、 新 的 SRAM 器件， 恰巧 就 在 我 们 需要 使 用 它 时 这 个 器 件 却 不 能 供 
货 了 。 因 此 ,我 们 可 以 通过 寻找 一 个 可 用 性 较 好 但 性 能 差 些 的 替代 器 件 来 降低 风险 。 这 样 ， 我 们 
在 设计 系统 时 就 可 以 选择 两 者 中 的 任意 一 个 了 。 如 果 高 风险 的 部 分 只 是 不 能 及 时 供 货 ， 而 不 是 完 
全 不 能 供 货 ， 我 们 可 以 先 完成 一 个 性 能 稍微 逊色 一 点 的 系统 ， 当 新 器 件 可 以 供 货 时 再 进行 升级 。 

忽视 风险 、 期 望 它们 和 赁 空 消失 都 不 可 能 缓解 风险 。 一 定 可 以 让 项 目 失败 的 方法 ， 我 们 称 之 
为 否认 。 

在 有 条 理 的 风险 管理 过 程 中 ,通常 会 对 已 经 明确 的 风险 进行 周期 性 的 审查 ( 例如， 每 周一 
次 或 两 次 ) 。 在 每 次 审查 时 ， 风 险 的 重要 性 和 危险 性 都 会 基于 新 信息 进行 更 新 。 这 个 能 使 风险 
缓解 的 审查 过 程 ， 工 程 团 队 都 可 看 到 。 无 论 是 通过 信息 收集 还 是 备 选 计划 ， 成 功 缓解 的 风险 将 
使 其 危险 性 随时 间 的 推移 而 稳步 下 降 。 那 些 没有 得 到 恰当 管理 的 风险 ， 其 危险 程度 依然 很 高 ， 
这 些 风险 应 该 引起 注意 ， 以 便 能 够 更 成 功 地 管理 它们 。 

概念 开发 阶段 的 结果 是 第 二 份 英 文 文档 ， 详 细 描 述 了 如 何 设计 对 象 。 它 描述 了 所 采用 的 设 
计 方 法 的 关键 方面 ， 给 出 了 每 个 方面 的 理由 。 它 明确 了 所 有 的 外 部 参与 者 : 芯片 供应 商 、 包 装 
供应 商 、 接 插件 供应 商 、 电 路 板 供应 商 、CAD 工具 提供 商 、 设 计 服 务 提供 商 等 。 这 份 文档 也 明 
确 了 所 有 的 风险 ,并 且 给 出 这 些 风险 为 何 值得 一 试 的 理由 ， 还 描述 了 为 了 缓解 风险 所 采取 的 完 
善 的 和 正在 完善 的 策略 。 不 同 的 公司 对 于 这 份 讲述 如 何 设 计 的 文档 采用 不 同 的 名 称 ， 通 常 称 之 
为 实施 设计 规格 和 产品 实施 计划 。 


2.1.3 划分 与 详细 设计 


一 旦 概念 阶段 完成 ， 并且 已 经 做 出 了 设计 决策 ， 那 么 剩 下 的 就 是 将 设计 划分 成 模块 ， 然 后 
完成 每 个 模块 的 详细 设计 。 高 层 系统 划分 通常 是 作为 概念 设计 过 程 的 一 部 分 。 在 为 每 一 个 高 层 
模块 撰写 设计 规格 时 ， 要 特别 注意 它们 之 间 的 接口 。 这 些 设计 规格 使 得 模块 能 够 独立 设计 ， 并 
且 如 果 它 们 都 符合 设计 规范 ， 则 在 系统 集成 时 将 所 有 模块 连 在 一 起 就 可 以 工作 。 

在 一 个 复杂 的 系统 中 ， 顶 层 模块 本 身 也 将 被 划分 为 子 模块 ， 诸 如 此 类 。 将 模块 划分 为 子 模 
块 通常 被 称 为 块 级 设计 ， 因 为 它 是 通过 绘制 系统 的 方块 图 (也 称 结 构图 ) 来 实现 的 。 图 中 每 
个 方块 代表 一 个 模块 或 子 模块 ， 而 模块 间 的 连 线 则 代表 了 模块 间 交互 的 接口 。 
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最 终 ， 我 们 要 将 模块 细 分 到 其 每 个 子 模块 都 可 以 通过 一 个 综合 过 程 直接 实现 的 程度 。 这 些 
底层 模块 也 许 是 根据 输入 计算 逻辑 函数 的 组 合 逻 辑 块 、 用 于 处 理 数字 的 算术 运算 模块 以 及 对 系 
统 的 操作 进行 排序 的 有 限 状 态 机 。 本 书 的 大 部 分 内 容 集中 在 这 些 底层 模块 的 设计 与 分 析 上 ， 保 
持 这 种 适用 于 更 大 系统 的 观点 是 非常 重要 的 。 


2.1.4 验证 


在 一 个 典型 的 设计 项 目 中 ,一 多 半 的 精力 并 不 是 在 设计 上 ， 而 是 在 验证 设计 是 否 正 确 上 。 
验证 的 操作 发 生 在 所 有 层面 : 上 至 概念 的 设计 ， 下 至 独立 的 模块 。 在 最 高 层面 ， 概 念 设计 完 
架构 的 验证 。 在 此 过 程 中 ,要 依据 设计 规格 来 核对 概念 设计 ， 以 确保 通过 实现 满足 设计 规格 中 
的 每 一 项 需求 。 

编写 单元 测试 是 用 来 验证 每 个 单独 模块 的 功能 。 典 型 的 ， 测 试 代码 的 行 数 要 远 比 实现 模块 
的 Verilog 行 数 多 得 多 。 在 单独 模块 验证 之 后 ， 它 们 会 被 集成 到 封闭 的 子 系统 中 ， 然 后 在 模块 
层级 的 下 一 层 重 复 这 个 过 程 。 最 终 ， 将 整个 系统 集成 在 一 起 ， 并 且 运 行 一 套 完 整 的 测试 来 验证 
系统 实现 了 设计 规格 中 所 有 的 功能 。 

验证 工作 通常 是 根据 男 一 个 称 之 为 测试 计划 的 书面 文档 文件 来 完成 。” 在 测试 计划 中 ， 要 
明确 被 测 设备 (device under test, DUT) 的 每 一 个 特点 ， 并 且 规 定 的 测试 要 覆盖 所 有 明确 的 特 
点 。 测 试 的 一 大 部 分 就 是 处 理 偏差 情况 (系统 如 何 响应 超出 其 正常 工作 模式 的 输入 ) 和 边界 
情况 (输入 刚好 在 正常 工作 模式 之 内 或 之 外 )。 

所 有 测试 的 大 部 分 子 集 通常 分 组 到 回归 测试 用 例 集中 ， 并 会 在 设计 上 周期 性 地 (经常 是 每 
天 晚上 ) 运行 ， 变 化 会 随时 登记 到 版 本 控制 系统 中 。 回 归 用 例 集 的 目的 是 确保 设计 不 会 倒退 ， 
即 确保 设计 人 员 在 修复 一 个 bug 时 ， 不 会 引起 其 他 的 测试 失败 。 

当时 间 短 、 资 源 少 时 ， 工 程 师 们 有 时 会 试图 走 捷 径 并 跳 过 一 些 验证 。 这 几乎 从 来 不 是 一 个 
好 的 主意 。 对 于 验证 ， 一 个 正确 的 理念 是 : 如 果 它 没 经 过 测试 ， 它 不 会 工作 。 每 个 特点 、 模 式 
以 及 边界 条 件 都 必须 测试 。 从 长 远 来 看 ， 如 果 你 完成 了 验证 的 每 一 个 步骤 并 抵制 住 了 走 捷径 的 
诱惑 ， 设 计 将 更 快 地 投入 生产 。 

所 有 的 设计 都 会 有 bug， 即 便 是 顶级 工程 师 也 一 样 。bug 发 现 的 越 早 ， 修 复 bug 所 需 的 时 间 
和 金钱 越 少 。 根 据 以 往 经 验 ， 设 计 每 次 向 前 进行 一 个 主要 步骤 时 ， 修 复 bug 的 成 本 便 会 增加 10 
倍 。 在 单元 测试 中 发 现 bug 时 ， 修 复 是 最 便宜 的 。 一 个 蒙混 过 了 单元 测试 但 在 集成 测试 中 被 逮 
住 的 bug， 修 复 的 成 本 要 高 出 10 倍 以 上 。s 一 个 通过 了 集成 测试 但 在 整体 系统 测试 中 落网 的 
bug， 修 复 成 本 又 会 高 出 10 FW (ER bug 是 单元 测试 的 100 倍 以 上 ) 。 如 果 bug 通过 了 系统 
测试 ， 而 直到 芯片 已 经 流 片 并 封装 后 的 硅 片 调试 时 才 被 逮 住 ， 修 复 成 本 会 再 次 高 出 10 倍 以 上 。 
直到 芯片 投产 〈 并 且 必 须要 召回 ) 之 前 都 没 被 建 住 的 bug， 修复 该 bug 的 成 本 是 单元 测试 中 的 
10 ~ 10 000 倍 以 上 。 你 要 抓 住 这 一 点 : 不 要 音 音 测 试 。 你 发 现 bug 越 早 ， 修 复 它 越 容 易 。 


2.2 数字 系统 由 芯片 和 电路 板 构 建 


现代 数字 系统 是 通过 在 电路 板 上 将 标准 的 集成 电路 和 定制 的 集成 电路 相互 连接 在 一 起 的 方 
式 实现 的 ， 电 路 板 又 通过 接 插 件 和 电缆 相互 连接 。 

标准 的 集成 电路 是 可 以 按照 产品 目录 订购 的 器 件 , 包括 所 有 类 型 的 存储 器 (SRAM、 
DRAM, ROM, EPROM, EEPROM 等 )、 可 编程 逻辑 (FPGA 部 分 ， 见 下 文 ) 、 微 处 理 器 以 及 标 
准 外 设 接口 。 设 计 人 员 都 会 尽 可 能 使 用 标准 的 集成 电路 来 实现 某 个 功能 ， 因 为 这 些 元 器 件 易 于 


O 正如 你 所 见 ， 大 多 数 工程 师 撰 写 英文 文档 比 编写 Verilog 或 C 代码 花费 的 时 间 更 多 。 
O ”可 能 会 有 一 个 或 更 多 个 子 系统 测试 级 ， 每 级 的 成 本 都 以 10 为 倍数 增长 ， 
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购买 、 不 需要 开发 成 本 或 精力 ， 并 且 与 这 些 元 器 件 相 关联 的 风险 通常 很 小 。 然 而 ， 在 某 些 情 况 
下 ,使 用 标准 的 元 器 件 并 不 能 实现 某 个 性 能 、 功 率 或 成 本 的 设计 规格 ， 因 此 必须 设计 一 个 定制 
的 集成 电路 。 

定制 的 集成 电路 (有 时 称 为 ASIC， 适合 特殊 用 途 的 集成 电路 ) 就 是 为 某 一 特定 功能 制造 
的 芯片 。 或 者 换 名 话说， 它们 是 你 自己 设计 的 芯片 ， 因 为 你 无 法 在 产品 目录 中 找到 你 需要 的 。 
大 多 数 ASIC 都 是 使 用 标准 单元 ( standard cell) 没 计 方法 来 制造 的 ， 该 方法 从 库 中 选择 标准 模 
块 (单元 ) 并 在 硅 片 上 实例 化 和 互 连 。 典 型 的 标准 单元 包括 简单 的 门 电路 、SRAM 和 ROM 存 
储 器 以 及 LO 电路。 一 些 供应 商 还 提供 诸如 算术 运算 单元 、 微 处 理 器 和 标准 外 设 接口 等 更 高 阶 
的 模块 ， 即 可 能 是 以 单元 形式 ,也 可 能 是 以 可 综合 的 HDL (如 Verilog) 编写 的 代码 形式 提供 。 
因此 ， 用 标准 单元 设计 ASIC 类 似 于 用 标准 器 件 设计 电路 板 。 在 这 两 种 情况 下 ,设计 人 员 (或 
者 CAD LE) 从 产品 目录 中 选择 单元 ， 并 指明 它们 如 何 连接 。 使 用 标准 单元 来 制造 ASIC 与 在 
电路 板 上 使 用 标准 器 件 具有 相同 的 优点 : 减少 开发 成 本 低 和 降低 风险 。 在 极 少数 情况 下 ， 设 计 
ee 相 比 于 标准 单元 逻辑 ， 这 种 定制 的 单元 可 以 提供 
优 于 标准 单元 的 显著 的 性 能 、 面 积 和 功率 ,但 应 该 着 慎 使 用 ， 因 为 它们 会 牵扯 很 大 的 设计 精 
A, 也 是 主要 的 风险 因素 。 

作为 定制 的 集成 电路 实例 ， 图 2-2 展示 了 英 伟 达 公 司 的 “Fermi”GPU [85，110]。 该 芯片 采 
用 40 纳米 的 CMOS 工艺 制造 而 成 ， 内 部 含有 超过 3 x 10 个 晶体 管 。 它 含有 16 个 流 多 处 理 器 (在 
裸 片 的 上 下 4 行内 ) ， 每 个 处 理 器 包含 32 个 CUDA 核 ， 共计 512 个 核 。 每 个 核 包含 一 个 整数 单元 
和 一 个 双 精 度 浮 点 单元 。 在 裸 片 的 中 心 可 以 看 到 一 个 交叉 开关 (参见 24.3 节 ) 。 连 接 到 GDDR5 
DRAM (参见 25.1.2 节 ) 的 6 个 64 位 分 区 (总 共 384 位 ) 占据 了 芯片 的 大 部 分 外 围 部 分 。 





图 2-2” 英 伟 达 公司 的 Fermi GPU 的 裸 片 照片 。 该 芯片 采用 40 纳米 的 CMOS 工艺 制造 ， 包 含 了 
= = 多 亿 个 晶体 管 


现场 可 编程 门 阵列 (FPGA) 介 于 标准 器 件 和 ASIC 之 间 ， 它 们 是 可 以 通过 编程 实现 任意 功 
能 的 标准 器 件 。 虽 然 效率 明显 低 于 ASIC， 但 它们 非常 适合 在 要 求 不 高 的 、 用 量 少 的 应 用 中 实现 
定制 逻辑 。 大 型 FPGA (如 Xilinx Vitex 7) 包含 高 达 200 万 个 逻辑 单元 ， 超过 10 MB 的 SRAM, 
多 个 微 处 理 器 和 数 百 个 算术 运算 基础 单元 。 与 固定 的 标准 单元 逻辑 相 比 ， 可 编程 逻辑 器 件 的 密 
度 明 显 低 (超过 一 个 数量 级 ) 、 能 量 效率 低 、 运 行 速度 慢 。 这 使 得 它 在 大 批量 应 用 中 成 本 过 
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高 。 然 而 ， 在 用 量 少 的 应 用 中 ,与 ASIC 的 加 工 成 本 相 比 ， 虽 然 FPGA 的 单位 成 本 高 ， 但 还 是 
具有 一 定 吸 引力 的 。 制 造 28 纳米 的 ASIC 要 花费 300 万 美元 ， 还 不 包括 设计 成 本 。ASIC 一 次 性 
成 本 ?大 约 是 2000 万 到 4000 万 美元 。 

为 了 让 您 了 解 什么 适合 于 典型 的 ASIC， 表 2-1 列 出 了 以 栅 格 为 单位 的 多 个 典型 数字 基础 单 
元 的 面积 (Xx ) 。 栅 格 是 在 x Al y 轴 方 向 上 相 邻 的 最 小 间隔 线 的 中 心 线 之 间 的 区 域 。 在 当前 的 
28 纳米 工艺 中 ， 最 小 线 间 距 X = 90 nm， 故 一 个 栅 格 的 面积 六 =8100 nm 。 在 这 种 工艺 中 ， 每 平 
方 毫米 就 有 1.2 x 10° 个 栅 格 (1.2 x 10° 个 机 格 /mm ) ， 即 在 足以 容 下 3000 万 与 非 门 、 相 对 较 
小 的 10 mm 的 裸 片 中 就 有 1. 2 x10 个 栅 格 。 在 20 世纪 80 年 代 中 期 ， 一 个 简单 的 32 位 RISC 
处 理 器 就 要 占用 整个 芯片 ， 现 在 占用 的 面积 小 于 0.01 mm 。 如 2.4 节 所 述 ， 每 隔 18 个 月 ， 每 

个 芯片 的 栅 格 数量 就 会 增加 一 倍 ， 因 此 可 以 在 芯片 上 封装 的 元 器 件数 量 也 在 不 断 增 加 。 


表 2-1 集成 电路 器 件 的 栅 格 面积 











模 å R 面积 (4848) 
DRAM 的 1 位 2 


模 块 面积 ( 栅 格 ) 
触发 器 300 





ROM 的 1 位 2 行 波 进位 加 法 器 的 1 位 500 
SRAM 的 1 位 24 32 位 超前 进位 加 法 器 30 000 
两 输入 与 非 门 40 32 位 乘法 器 300 000 


静态 锁 存 器 32 位 RISC 微 处 理 器 (w/o 高 速 缓存 ) 
例 2-1 估算 芯片 面积 

估算 8 阶 FIR 滤波 器 所 占用 的 芯片 面积 的 总 和 。 所 有 的 输入 都 是 32 位 宽 (i), 滤波 器 在 
触发 器 中 存储 8 个 32 位 (w) 的 权 值 。 oo (A) RSS Ps 


X= Xi xu, 

用 于 存储 权 值 、 来 法 器 和 加 法 器 的 面积 可 以 计算 如 下 : 

A, = 8 x 32 x A, = 7. 68 x 10° 个 栅 格 

A, = 8 x A, = 2.4 x 10° A 

A, = 7 x A,u = 2.1 x10 Ait 

因为 我 们 采用 了 可 以 成 对 减少 加 数 (12.3 节 ) 的 树 形 结构 ， 我 们 仅 需 要 7 个 加 法 器 。 
为 了 得 到 在 28 nm 工艺 下 的 总 面积 ， 我 们 合计 每 个 元 器 件 的 面积 ， 该 面积 为 乘法 器 所 左右 : 
Ay, = A, +A, +A, = 2.69 x10' 个 栅 格 = 0.022 mm? 


ANSE ASE, tS He VO 带宽 并 不 像 每 个 芯片 的 栅 格 数量 增长 的 那么 快 。 受 到 一 系列 因素 的 影 
响 ， 现 代 芯片 被 限制 在 大 约 1000 个 引 脚 ， 而 诸多 的 引 脚 数量 则 导致 了 高 郧 的 成 本 。 限 制 引 脚 
数 和 驾驭 成 本 的 主要 因素 之 一 是 印刷 电路 板 可 以 做 得 到 的 密度 。 3% H HEX, ( escape pattern ) 是 
针对 引 脚 数量 很 多 的 集成 电路 ， 要 从 芯片 封装 的 下 面 引出 所 有 的 信号 线 ， 对 印 制 电路 板 的 密度 
有 一 定 的 压力 ， 因 此 通常 需要 增加 额外 的 层 数 (成 本 也 因此 增加 )。 

现代 的 电路 板 是 在 玻璃 布 - 环 氧 树脂 覆 铜 箱 板 层 间 加 预 浸 玻 璃 布 - 环 氧 树脂 基层 板 # JE: 
而 成 。 覆 铜板 通过 光 刻 绘制 连 线 ， 然 后 倒 层 在 一 起 。 层 与 层 之 间 的 连接 则 是 通过 对 电路 板 钴 
fL, 并 电镀 这 些 过 孔 而 实现 的 。 电 路 板 可 以 做 成 很 多 层 ， 但 成 本 昂贵 ,，20 层 及 以 上 的 电路 板 
就 不 常见 了 ， 更 经 济 的 电路 板 有 10 层 或 者 更 少 。 层 通常 在 x 信号 层 ( 即 在 x 方向 传递 信号 )、 


O “一 次 性 支付 的 成 本 ， 不 考虑 制造 的 芯片 数量 。 
O ”浸渍 环 氧 树 陛 上 且 尚未 加 工 的 玻璃 纤维 布 。 
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输 线 提供 一 个 返回 的 路 径 。 信 号 层 内 可 采用 的 最 小 线 宽 及 线 间距 是 3 mil ( 即 0.003 英寸 ， 约 
75 hm) 。 稍 便宜 的 电路 板 布线 则 采用 的 是 5 mil 线 宽 和 线 间距 的 规则 。 

连接 各 层 的 过 孔 是 制约 线路 板 密度 的 主要 因素 。 由 于 电镀 的 限制 ， 过 孔 必 须要 有 一 个 不 大 
于 10 :1 的 纵横 比 〈 板 的 厚度 和 过 和 孔 直 径 之 比 ) 。 即 一 个 板 厚 为 0.1 英寸 的 线路 板 ， 过 和 孔 的 最 
小 直径 为 0.01 英寸 。 过 孔 到 过 孔 中 心 线 的 最 小 间距 为 25 mil ( 即 每 英寸 40 个 过 孔 ) 。 例 如 ， 可 
以 参考 在 mm 球 栅 阵 列 封装 (BGA) 中 的 逸 出 模式 。 采 用 5 mil 连 线 和 线 间 距 ， 过 和 孔 之 间 的 空 
间 仅 能 允许 一 根 信号 导线 穿 过 (如果 采用 3 mil 的 线 宽 和 线 间距 ， 则 过 孔 间 可 容 下 两 根 导线 )， 
在 将 芯片 周边 的 第 一 圈 信 号 引出 后 ， 每 一 排 信号 引 脚 在 引出 的 时 候 都 需要 引 到 不 同 的 信号 层 内 。 

图 2-3 展示 了 超级 计算 机 Cray XT6 的 一 块 电路 板 。 该 板 尺寸 为 22. 58 x 14. 44 英寸 ， AA 
了 多 个 集成 电路 和 模块 。 在 电路 板 的 左 侧 是 两 片 Gemini (双子 座 ) 路 由 芯片 ， 即 Cray ASIC, 
它们 构成 一 个 系统 级 的 互联 网 络 ( 见 24.4 节 )。 你 所 看 到 的 Gemini 芯片 (和 大 多 数 其 他 世 片 ) 
是 金属 散热 片 ， 金 属 散 热 片 将 热量 从 芯片 中 吸出 形成 强制 空气 冷却 。 紧 挨 着 Gemini 芯片 的 是 
16 个 DRAM DIMM 模块 ， 它 们 为 超级 计算 机 节点 提供 主 内 存 。 下 一 个 是 4 Fr AMD Opteron 8 核 
CPU 芯片 。 电 路 板 的 右 侧 、 大 的 铜 散 热 片 下 面 ， 是 4 个 NVIDIA Fermi C2090X GPU 模块 。 这 些 
模块 本 身 就 是 一 个 小 型 印 制 电路 板 ， 其 中 包含 一 个 Fermi GPU 芯片 〈 如 图 2-2 所 示 )、24 片 
GDDR5 DRAM iH, GPU 的 稳 压 器 和 存储 器 。 

连接 器 将 信号 从 一 块 电 路 板 传送 到 另 一 块 电路 板 ， 直 角 连 接 器 将 板 卡 连 接 到 在 板 卡 之 间 传 
送信 和 号 的 底板 上 或 转 接 板 上 。 图 2-3 中 Cray 模块 的 最 左 侧 就 有 这 样 一 个 连接 器 ， 该 连接 器 插入 
本 身 就 是 一 块 印刷 电路 板 的 底板 中 。 底 板 上 有 负责 为 插 在 底板 上 的 模块 提供 连接 的 信号 层 。 底 
板 还 设 有 电缆 连接 器 ， 其 通过 电缆 或 光缆 将 模块 连接 到 其 他 底板 上 的 模块 。 

共 面 的 连接 器 连接 子 卡 到 母 板 上 ， 图 2-3 中 右 侧 的 4 个 NVIDIA GPU 便 是 通过 这 种 共 面 的 
连接 器 与 Cray 模块 连接 的 。 

电子 设备 的 封装 在 参考 文献 [32] 中 有 更 详细 的 描述 。 





图 2-3 超级 计算 机 Cray XT6 的 一 块 节点 板 。 该 板 包含 〈 自 左 到 右 ) 两 片 路 由 芯片 ，16 个 
DRAM DIMM 模块 ，4 个 AMD Opteron 8 核 处 理 器 和 4 个 NVIDIA Fermi GPU 模块 (Sil 
图 2-2) 。 大 多 数 芯 片 和 模块 可 以 看 见 的 部 分 都 是 它们 的 散热 器 


2.3 计算 机 辅助 设计 工具 
现代 数字 设计 人 员 用 许多 计算 机 辅助 设计 (computer-aided design, CAD) 工具 协助 工作 。 
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CAD 工具 是 帮助 管理 设计 过 程 中 的 一 个 或 多 个 方面 的 计算 机 程序 。 它 们 分 为 三 大 类 : 获取 、 合 

成 和 验证 。CAD 工具 的 存在 是 用 于 进行 逻辑 、 电 气 和 物 

理 设计 。 我 们 在 图 2-4 中 展示 了 一 个 设计 流程 示例 。 
顾名思义 ， 获 取 工 具 用 来 帮助 获取 设计 。 最 常见 的 } 

获取 工具 是 原理 图 编辑 器 。 由 于 分 层 图 显示 了 所 有 模块 i 

与 子 模块 之 间 的 连接 ， 设 计 人 员 利 用 该 工具 可 以 进入 设 

计 。 对 于 很 多 设计 而 言 ， 使 用 的 都 是 诸如 Verilog 这 类 文 

本 的 硬件 描述 语言 (HDL) ， 而 不 是 原理 图 ， 并 使 用 文 

本 编辑 器 来 获取 设计 。 除 少数 例外 ,文本 的 设计 获取 远 

比 原理 图 获取 更 富有 成 效 。 

一 旦 设计 获取 后 ， 便 会 使 用 验证 工具 来 确保 它 的 正 
确 性 。 在 设计 提交 之 前 ， 必 须 确保 它 的 功能 正确 、 符 合 
时 序 约束 并 且 没 有 违反 电气 规则 。 仿 真 器 用 于 测试 原理 
图 或 HDL 设计 的 功能 。 编 写 测试 脚本 ,施加 输入 并 观察 
设计 的 输出 ， 如 果 输 出 与 预期 不 符 ， 则 标记 为 错误 。 然 

















而 ,仿真 器 取决 于 测试 用 例 ， 测 试 没有 暴露 的 错误 , 仿 
真 器 也 不 会 发 现 它 。 形 式 验证 工具 使 用 数学 证 明 的 方法 hens 
来 证 明 设 计 符合 设计 规格 与 测试 用 例 无 关 ) snp O” I ee ee eee 
序 分 析 器 验证 设计 符合 时 序 约束 〈 也 与 测试 用 例 无 关 ) 。 ene te 
我 们 将 在 第 20 章 进一步 详 述 验证 。 规划 ， 并 将 设计 综合 为 逻辑 
综合 工具 可 以 使 得 设计 从 一 个 抽象 级 降低 到 一 个 较 门 ， 然 后 进行 布局 和 布线 。 
低 的 抽象 级 ， 从 而 简化 设计 。 GIN, BMRA T B 3: 设计 的 最 终 测试 包括 时 序 分 
一 个 使 用 诸如 Verilog 的 HDL 设计 的 高 层 描述 ， 并 将 其 析 、 布 局 和 布线 网 表 的 最 终 
简化 为 门 级 网 表 。 逻 辑 综合 工具 在 很 大 程度 上 淘汰 了 手 验证 以 及 最 终 的 物理 设计 检 
工 组 合 逻辑 电路 设计 ， 从 而 显著 提高 了 设计 人 员 的 效率 。 查 。 因 为 实现 是 不 断 完 善 和 
布局 布线 的 工具 采用 门 级 网 表 ， 通 过 放置 独立 的 门 电路 优化 的 ， 因 此 没有 图 示 从 所 
并 在 它们 之 间 布 线 来 将 其 简化 为 物理 设计 。 有 的 框 到 HDL 设计 


在 现代 的 ASIC AI FPGA 中 ， 延 时 和 功率 中 很 大 一 部 分 在 于 门 电路 以 及 其 他 单元 互联 的 连 
线 ， 而 不 是 门 电路 或 单元 本 身 。 实 现 高 性 能 (和 低 功 率 ) 需要 管理 布局 的 过 程 ， 以 确保 关键 
信号 只 经 过 很 短 的 距离 。 保 证 信号 走 线 短 的 最 好 实现 方法 是 手工 将 设计 划分 成 不 超过 50 000 个 
门 电路 (200 万 个 栅 格 ) 的 模块 ， 制 定 一 个 布局 规划 ， 表 明 每 个 模块 放置 的 位 置 ， 并 将 每 个 模 
块 分 别 放置 到 布局 规划 中 其 相应 的 区 域 。 

CAD 工具 同样 可 以 用 来 进行 集成 电路 的 生产 制造 测试 ， 这 些 测试 将 证 明 特 定 的 芯片 在 下 
线 后 能 正常 工作 。 通 过 扫描 测试 模式 可 以 深入 到 芯片 的 触发 器 (出 于 这 个 目的 ， 芯 片 被 配置 成 
一 个 大 型 移 位 寄存 器 ) 、 各 个 晶体 管 和 复杂 的 连 线 之 中 ， 因 此 现代 集成 电路 可 以 用 数量 相对 较 
少 的 测试 模式 来 验证 。 

但 是 ，CAD 工具 经 常会 限制 大 型 的 设计 ， 会 将 它们 分 成 一 系列 小 得 多 的 设计 ， 这 样 就 可 以 利 
用 特定 的 工具 集 轻 易 地 完成 设计 。 然 而 ， 一 些 能 够 极 大 提高 设计 效率 的 技术 往往 不 允许 使 用 ， 不 
是 因为 它们 本 身 具 有 风险 ， 而 是 因为 它们 不 能 与 某 个 特别 的 综合 流程 或 是 验证 步骤 一 同 工 作 。 这 
是 令 人 遗憾 的 ，CAD 工具 应 该 是 用 来 简化 设计 人 员 的 工作 ， 而 不 是 限制 他 们 设计 的 范围 。 


2.4 摩尔 定律 和 数字 系统 演变 
1965 4E, XÆ - 摩尔 (Gordon Moore) 预测 集成 电路 上 晶体 管 的 数量 将 会 每 年 翻 一 番 。 这 
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种 电路 密度 呈 指 数 增长 的 预测 ， BERGET O PZA, 并 逐步 成 为 人 们 熟知 的 摩尔 定律 。 随 
着 时 间 的 推移 ， 每 年 翻 一 番 的 预测 已 经 被 修正 为 每 18 ~ 20 个 月 翻 一 番 ， 但 即便 如 此 ， 增 长 的 
速度 依旧 迅猛 。 集 成 电路 上 的 元 器 件 〈 或 栅 格 ) 的 数量 正在 以 每 年 超过 50% 的 复合 增长 率 增 
长 ， 大 约 每 5 年 增长 一 个 数量 级 。 这 些 信息 绘制 在 图 2-5 中 。 
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图 2-5 几 十 年 来 商用 处 理 器 上 的 唱 体 管 数 量 ， 说 明了 摩尔 定律 


多 年 以 来 (从 20 世纪 60 年 代 大 约 到 2005 年 ) ， 电 压缩 放 与 栅 极 长 度 呈 线性 关系 。 因 为 这 
个 常数 域 或 登 纳 德 缩放 比例 定律 【36] ， 随 着 器 件数 量 的 增加 ， 器 件 运 行 速 度 也 会 更 快 ， 能 耗 
也 变 得 更 低 。 粗 略 地 讲 ， 当 半导体 工艺 的 线性 尺寸 工 减 半 时 ， 器 件 所 需 的 面积 按 比 例 缩 小 为 原 
来 面积 三 的 四 分 之 一 (1⁄4 忆 ) 。 因 此 ,在 相同 的 面积 上 我 们 可 以 放下 原来 4 倍 的 器 件 。 由 于 
常数 域 缩 放 比 例 ， 器 件 的 延 时 也 与 也 成 正比 ， 因 此 当 工 减 半 时 ， 使 得 这 些 器 件 的 速度 都 加 快 到 
了 原来 的 两 倍 。 由 于 C、V 都 与 7 成 正比 ， 因 此 开关 单个 设备 所 消耗 的 能 量 E. = C 与 二 缩 
放 比 例 一 样 。 因 此 ， 回 到 以 前 常数 域 缩放 比例 的 好 日 子 里 ， 每 当 工 减 半 时 ， 对 于 相同 的 功率 ， 
我 们 的 电路 可 以 完成 8 倍 的 工作 (4 倍数 量 的 器 件 运行 速度 是 原来 的 2 倍 ) o 

很 遗憾 ， 器 件 运 行 速度 和 电源 电压 这 种 线性 缩放 比例 早 在 2005 年 就 结束 了 。 从 那 时 起 ， 
尽管 工 持 续 减 小 ， 电 源 电压 大 致 保持 恒定 在 1 V 左右 。 在 这 种 新 的 恒 压 缩放 比例 定律 中 ， 每 当 
L 减 半 ， 每 个 单位 面积 上 器 件 的 数量 仍 是 原来 的 4 倍 。 然 而 ， 现 在 它们 的 运行 速度 只 会 稍微 变 
TR (大 约 快 25%)， 最 重要 的 是 ，Esw 只 会 线性 减少 ， 因 为 V 保持 恒 定 。 因 此 ， 在 这 个 新 时 期 ， 
每 当 我 们 将 三 减 半 时 ， 在 每 单位 面积 上 ,我们 用 2.5 倍 的 功率 完成 5 售 的 工作 (4 们 同样 多 的 
器 件 运行 速度 是 原来 的 1. 25 倍 ) 。 显 而 易 见 ， 在 这 种 恒 压 缩放 比例 定律 下 ， 世 片 很 快 就 达到 了 
它们 受 限制 的 程度 ， 受 限制 的 因素 不 是 芯片 上 集成 的 器 件 的 数量 ， 而 是 功率 。 

对 于 数字 系统 设计 人 员 来 说 ， 摩 尔 定律 让 世界 变 得 更 加 有 趣 。 每 次 集成 电路 的 密度 增加 一 或 
两 个 数量 级 〈 每 5~ 10 年 ) 时 ， 所 设计 的 系统 类 型 和 用 于 设计 它们 的 方法 就 会 发 生 一 次 质 的 变 
化 。 相 比 之 下 ， 大 多 数 工程 学 科 是 相对 稳定 的 一 一 缓慢 的 、 渐 进 的 改进 。 你 不 会 看 到 汽车 每 3 年 
就 提高 8 倍 的 能 源 效率 。 每 次 发 生 这 样 的 质变 时 ， 一 代 设计 人 员 就 不 得 不 像 一 张 白 纸 一 样 重新 开 
始 工作 了 ， 因 为 之 前 积累 的 关于 如 何 最 好 地 构建 一 个 系统 的 知识 都 已 经 不 再 适用 了 。 幸 运 的 是 ， 
数字 设计 的 基本 原理 在 技术 尺度 上 仍然 是 不 变 的 ; 然而 ， 每 一 代 技 术 的 设计 实践 都 有 显著 的 变化 。 

在 数字 设计 中 变化 的 步伐 之 快意 味 着 数字 设计 人 员 在 整个 职业 生涯 中 必须 要 扮演 一 个 学 生 
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的 角色 ， 通 过 不 断 地 学 习 才 能 跟 上 新 的 工艺 、 技 术 和 设计 方法 。 这 种 持续 的 教育 通常 包括 阅读 
行业 新 闻 (EE Times 是 一 个 很 好 的 起 点 ) ， 跟 踪 制 造 公 司 、 芯 片 供 应 商 和 CAD 工具 供应 商 的 新 
产品 公告 ， 并 且 偶 尔 参加 一 个 正规 的 课程 ， 学 习 一 套 新 的 技能 或 更 新 原 有 的 技能 。 
例 2-2 摩尔 定律 

一 块 采用 2012 年 28 nm 工艺 实现 的 单个 滤波 器 的 面积 ， 估 计 在 2017 年 能 装 下 多 少 个 例 2-1 
中 的 FIR 滤波 器 。 

我 们 提高 年 增长 率 (1.5) 至 若干 年 (5 年 ) ， 给 出 下 列 FIR 滤波 器 增长 的 密度 : 

N = i S3017-2012 = 7. 6 


小 结 


在 本 章 中 ,你 对 数字 设计 如 何在 工业 中 进行 实践 只 是 慰 鸿 一 曾 。 我 们 从 描述 设计 流程 开 
始 ， 该 流程 从 规格 设计 出 发 ， 经 过 概念 开发 ， 到 详细 设计 和 验证 。 在 Verilog 获取 之 前 ， 数 字 
系统 是 用 英语 文档 设计 的 ， 其 中 包括 规格 设计 和 实施 计划 。 设 计 过 程 中 的 一 大 部 分 是 管理 风 
险 。 通 过 量化 风险 和 开发 方法 〈 如 备 选 计划 ) 来 缓解 风险 ， 人 们 便 可 以 获得 技术 上 积极 的 态 
势 ， 而 不 会 使 整个 项 目 置 于 危险 之 中 。 验 证 是 开发 过 程 的 很 大 一 部 分 ， 最 好 的 验证 规则 是 : 如 
果 它 没 经 过 测试 ， 它 不 会 工作 。 修 复 bug 的 成 本 在 设计 的 每 个 阶段 都 会 增加 一 个 数量 级 。 

现代 数字 系统 使 用 集成 电路 ( 芯片) 和 印 制 电路 板 来 实现 。 我 们 提出 了 一 个 简单 的 模型 ， 
用 于 估算 完成 特定 数字 逻辑 功能 所 需 的 芯片 面积 ， 并 给 出 了 芯片 和 电路 板 方面 的 实例 。 

现代 数字 设计 实践 大 量 使 用 计算 机 辅助 设计 (CAD) 工具 ,但 也 会 受 其 制约 。 这 些 工具 用 
于 设计 获取 、 仿 真 、 综 合 和 验证 ， 它 们 主要 在 逻辑 层 (操纵 Verilog 设计 和 门 级 网 表 ) 和 物理 
层 ( 操 纵 集成 电路 中 布线 层 的 形状 ) 进行 操作 。 

在 集成 电路 上 可 以 实现 最 少 的 晶体 管 数量 随时 间 呈 指数 增长 ， 即 每 18 个 月 增长 一 倍 。 这 
种 被 称 为 摩尔 定律 的 现象 使 得 数字 设计 成 为 一 个 经 常 不 断 变化 的 领域 ， 因 为 这 种 迅速 演变 的 技 
术 不 断 提 出 新 的 设计 挑战 ， 并 使 以 前 不 可 行 的 新 产品 成 为 可 能 。 


文献 说 明 


摩尔 在 《Electronics 》[81] 上 发 表 的 研究 论文 不 仅 预 测 了 器 件 的 数量 随时 间 呈 指数 增长 ， 
还 解释 了 为 什么 使 用 常数 域 缩 放 比 例会 导致 恒定 的 芯片 功率 。Brunvand [20] 综述 了 从 Verilog 到 
生产 的 现代 设计 流程 ， 还 展示 了 如 何 使 用 最 先进 的 CAD 工具 并 提供 了 一 系列 示例 。Brooks 的 
《The Mythical Man-Month) [18] 和 Kidder 的 《The Soul of a New Machine) [61] 的 两 本 书 整体 
都 在 讨论 工程 过 程 。Brooks 的 书 提供 了 几 篇 关于 软件 工程 的 文章 ， 不 过 很 多 经 验 教训 同样 适用 
于 硬件 工程 。Kidder 的 书 详 述 了 通过 1 年 的 课程 来 构建 一 台 迷 你 计算 机 。 两 本 书 都 值得 一 读 。 


习题 

2.1 设计 规格 ， 工 。 你 决定 构建 一 个 经 济 的 〈 便 宜 的 ) 视频 游戏 系统 。 请 提供 你 的 设计 规格 ， 包 括 元 
器 件 、 输 入 和 输出 以 及 媒体 设备 。 

2.2 设计 规格 ， 工 。 恭 喜 ， 习 题 2. 1 的 视频 游戏 控制 台 已 经 取得 了 很 大 的 成 功 。 请 提供 控制 台 的 第 2 版 
设计 规格 。 要 特别 关注 与 第 1 版 的 变化 ， 例 如 是 否 支 持 向 下 兼容 。 

2.3 设计 规格 ， 亚 。 给 出 一 个 交通 信号 灯 系 统 的 设计 规格 ， 以 便 放置 在 繁忙 的 十 字 路 口 。 需 要 考虑 的 点 
包括 : 有 多 少 个 灯 、 转 弯 车 道 、 行 人 和 灯亮 持续 的 时 间 。 你 可 以 假设 所 有 方向 的 交通 同样 繁忙 。 

2.4 购买 或 构建 ， 工 。 针 对 习题 2. 1 的 视频 游戏 系统 中 的 三 个 元 器 件 ， 请 提供 购买 或 构建 的 决定 及 理 
由 。 其 中 至 少 包括 一 个 “购买 ”决定 和 一 个 “构建 ”决定 。 

2.5 购买 或 构建 ， 下 。 如 果 你 的 任务 是 为 汽车 制作 气 塞 收 放 控 制 系统 ， 需 要 什么 元 器 件 ? 其 中 哪些 你 会 
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买 现成 的 ? 哪些 你 会 自己 设计 ? 为 什么 ?至少 你 需要 1 个 加 速度 计 、! 个 执行 器 和 1 个 集中 控制 器 。 

购买 或 构建 ， 亚 。 作 为 你 的 设计 中 的 一 部 分 ， 你 需要 购买 1 个 USB 控制 器 。 查 找 销售 USB 控制 器 

的 供应 商 (在线) 并 下 载 两 个 不 同型 号 的 USB 控制 器 的 数据 表 和 报价 。 它 们 的 主要 区 别 是 什么 ? 

风险 管理 。 你 负责 建造 下 一 代 电 子 汽 车 。 为 下 面 每 一 条 分 配 (并 解释 ) 一 个 回报 和 风险 的 有 序 对 

( 按 规模 从 1 ~5 2). 

(a) 使 用 一 个 试验 性 的 新 电池 ， 它 具有 你 当前 电池 5 倍 的 能 量 。 

(b) 安装 安全 带 。 

(e) 添加 1 个 杯 架 。 

(d) 安装 传感器 和 控制 系统 ， 当 汽车 司机 遇 到 育 点 时 以 便 提醒 他 们 。 

(e) 添加 一 个 完整 的 卫星 和 导航 系统 。 有 什么 风险 ? 

(f) 针对 你 的 车 ， 给 出 一 个 特征 是 (1, 5) 的 例子 。 

(g) 针对 你 的 车 ， 给 出 另 一 个 特征 是 (5, 5) 的 例子 。 

可 行 性 与 缓解 。 为 以 下 每 个 高 风险 任务 设计 可 行 性 分 析 或 缓解 风险 的 方法 : 

(a) 使 用 新 的 验证 方法 验证 关键 的 元 器 件 ; 

(b) 向 你 的 下 一 代 处 理 器 添加 一 条 新 指令 ; 

(c) 将 16 个 核 放置 到 下 一 代 处 理 器 芯片 上 ; 

(d) 将 你 的 设计 从 0. 13 pm 的 工艺 移植 到 28 nm; 

(e) 你 对 习题 2.7 (g) 的 回答 。 

MH AR, 1 。 用 表 2-1 估计 需要 多 大 面积 来 实现 输出 最 后 4 个 32 位 输入 值 的 平均 值 的 模块 。 你 

将 需要 用 触发 器 来 存储 最 后 三 个 输入 ，ROM 中 的 32 位 任意 权重 的 加 权 平 均值 是 多 少 ? 将 权重 存储 

在 SRAM 中 需要 多 大 面积 ? 

A mia, H. Btn xn 和 矩阵 的 基础 算 阵 乘法 运算 需要 3n 个 存储 单元 和 ww 个 混合 的 乘法 -加 法 

运算 。 对 于 这 个 问题 假设 矩阵 的 每 个 元 素 是 32 位 ， 并 使 用 表 2-1 中 的 元 器 件 尺寸 。 假 设 做 1 个 

混合 的 乘法 - 加 法 运算 总 共 需 要 5 ns; 也 就 是 说 ， 每 个 5 ns， 完 成 分 之 一 (1/ n) 矩阵 乘法 运 

算 。 功 能 单元 的 面积 等 于 32 位 乘法 器 和 32 位 加 法 器 之 和 。 

(a) 当 =500 时 ， 完 成 矩阵 乘法 运算 需要 多 少 SRAM 面积 ? 分 别 给 出 在 28 nm 工艺 下 以 栅 格 和 
mm” 为 单位 的 答案 。 

(b) 假如 你 只 有 一 个 混合 的 乘法 -加 法 器 ， 和 矩阵 乘法 需要 多 长 时 间 ? 

(e) 假定 你 的 面积 预算 为 10 mm*。 如 果 你 在 SRAM 之 外 的 所 有 裸 片面 积 上 布 满 乘法 -加 法 器 ， 运 
算 需要 多 长 时 间 ? 假设 每 个 功能 单元 每 5 ns 完成 一 次 乘法 - 加 法 运算 。 

芯片 面积 ， 亚 。 采 用 习题 2. 10 的 假设 ,在 1 ms 内 你 能 做 的 最 大 的 矩阵 乘法 是 什么 ? 随意 修改 专用 

于 存储 和 计算 的 裸 片面 积 的 比例 。 

SH mia, WV 。 采 用 习题 2. 10 的 假设 ,在 1 ps 内 你 能 做 的 最 大 的 矩阵 乘法 是 什么 ? 

芯片 和 电路 板 。 在 线 查找 一 张 计算 机 母 板 的 图 片 或 查验 你 自己 的 计算 机 ， 识 别 并 解释 在 主板 上 找 

到 的 、 至 少 三 个 不 同 的 芯片 的 功能 。 你 不 能 选择 CPU 、 图 形 处 理 器 或 DRAM 作为 你 的 芯片 之 一 。 

BGA 逸 出 模式 。 从 芯片 到 电路 板 上 不 同 部 位 的 连接 器 绘制 32 条 连 线 (每 侧 边 8 条 ) 的 逸 出 模式 。 

假设 所 有 的 连 线 必 须 在 电路 板 的 表层 上 布线 ， 并 且 不 能 相互 交叉 。 

CAD 工具 ， 工 。 从 图 2-4 中 挑选 两 个 功能 ,查找 并 描述 完成 每 个 功能 的 三 个 不 同 的 计算 机 程序 。 

他 们 是 否 是 免费 的 ? 为 了 指引 你 入 门 ， 业 内 领先 的 设计 供应 商 包 括 Synopsys 公司 和 Cadence 公司 。 

CAD 工具 ， 卫 。 为 什么 在 图 2-4 结束 时 需要 最 终 验 证 阶段 ? 

摩尔 定律 ， 工 。2011 年 , 约 20 mm x20 mm 芯片 有 30 亿 个 晶体 管 。 使 用 摩尔 定律 ，(a) 2015 年 

在 芯片 上 将 有 多 少 晶 体 管 ?” (b) 2020 年 在 芯片 上 将 有 多 少 晶 体 管 ? 

Bee, H. 2012 年 ， 一 些 制造 商 将 开始 生产 22 nm 处 理 器 。 如 果 我 们 假设 栅 极 长 度 与 由 摩尔 

定律 给 出 的 晶体 管 数量 的 平方 根 成 比例 ， 在 哪 年 栅 极 长 度 能 让 5 个 硅 原 子 横 穿 ? 

摩尔 定律 ， 亚 。 表 2-1 展示 了 RISC 处 理 器 和 SRAM 的 栅 格 面积 。 在 28 nm 工艺 中 ， 大 约 有 1.2x 

10° 个 栅 格 /mm 。 在 2011 年 的 28 nm 工艺 中 , 在 1 片 20 mmx20 mm 芯片 上 能 够 容纳 多 少 个 具有 

64 K 字 节 SRAM 的 RISC 处 理 器 ?在 2020 年 该 芯片 上 将 能 容纳 多 少 个 ? 
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布尔 代数 





在 数字 系统 中 ,使 用 布尔 代数 表示 收 辑 功能 。 布 尔 代数 有 两 个 元 素 0 和 1， 有 三 种 运算 ， 
分 别 是 :“ 与 ”运算 (AND), 用 人 表示 ;“ 或 ”运算 (OR), AV 表示 ;“ 非 ”运算 (NOT), 
用 添加 撤 号 或 上 横 符 号 的 二 进 制 变 量 表示 ,例如 ， 用 x' 或 者 x 表示 NOT (x) 。 这 些 运算 的 含 
义 分 别 是 : HHAH a 和 4 都 为 1 时, a 和 5 为 1; 当 a 或 5 为 1 时, aVb 为 1; 4a HOM, a 
为 真 。 

使 用 这 些 运 算 符 和 二 进 制 变量 可 以 表示 逻辑 表达 式 。 例 如 : 当 二 进 制 变 量 a AA, b 为 假 
时 ， 逻 辑 表 达 式 a Ab 为 真 。 对 于 一 个 具体 的 二 进 制 变量 或 二 进 制 变量 的 补 可 以 用 文字 (literal) 
KA. Blin, WH Ris a Ab AMP MF a 和 25。 布尔 代数 提供 了 一 组 操作 逻辑 表达 式 的 规 
则 ， 应 用 这 些 规 则 ， 可 以 化 简 逻 辑 表达 式 ， 可 以 把 逻辑 表达 式 表 示 为 标准 形式 (normal form), 
还 可 以 判断 两 个 逻辑 表达 式 是 否 等 价 。 

为 了 与 实数 的 乘法 和 加 法 相 区 别 ， 这 里 使 用 八 和 VV 符号 表示 “与 ”运算 和 “或 ”运算 ， 
Verilog HEH & All 表示 。 在 许多 教科 书 中 也 使 用 x 或 表示 “与 ”运算 ,用 + 表示 “或 ” 
运算 。 我 们 不 这 样 做 ， 这 样 做 会 导致 学 生 在 化 简 布尔 表达 式 时 认为 它们 是 一 般 代数 表达 式 ， 一 
般 代数 表达 式 是 整数 或 实数 上 的 + 和 x 运算 。 布 尔 代 数 和 一 般 代 数 的 性 质 虽 然 有 相似 之 处 ,但 
也 有 不 同 之 处 需要 特别 指出 的 是 ， 布 尔 代数 具有 对 偶 性 (下 面 会 提 到 ) ， 而 一 般 代数 没有 这 
个 性 质 。 在 布尔 代数 中 aV (bAc) =(aVb) A(aVc)， 而 在 一 般 代 数 中 w+(xc) 天 (ar+pb) x 
(a+c); 


我 们 将 会 在 研究 CMOS 逻辑 电路 〈 第 4 章 ) 和 组 合 逻 辑 设 计 (第 6 章 ) 时 用 到 布尔 代数 。 
3.1 公理 


布尔 代数 可 以 从 “与 ”运算 、“ 或 ”运算 和 “ 非 ”运算 的 定义 衍生 出 来 。 三 种 运算 用 真 值 
表 表示 ， 如 表 3-1 和 表 3-2 所 示 。 公 理 (axiom) 是 一 些 被 认为 总 是 正确 的 数学 陈述 ， 数 学 家 喜 
欢 用 公理 的 形式 表示 这 些 运算 的 定义 。 所 有 布尔 表达 式 都 可 以 从 下 列 公理 衍生 出 来 : 


自 等 律 1 人 xw=x, OVx=x, (3-1) 
O-1# OAx=0, 1Vx=1 (3-2) 
FER 0 =1， 1=0 (3-3) 


在 上 面 这 些 公 理 中 ,布尔 代数 的 对 偶 性 (duality) 是 显而易见 的 。 如 果 一 个 布尔 表达 式 的 
值 为 真 ， 在 下 面 两 种 情况 下 结果 仍 为 真 : (a) 用 和 人 替换 所 有 V ,， 用 V 替换 所 有 八 ; (b) 用 1 
替换 所 有 0， 用 0 替换 所 有 1。 这 就 是 对 偶 原则 。 因 为 公理 具有 对 偶 性 ， 布 尔 表达 式 又 是 由 公 
理 衍生 出 来 的 ， 所 以 布尔 表达 式 也 具有 对 偶 性 。 


表 3-1 “与 ” 运算 和 ay 运算 的 真 值 表 





a b aAb aVb a b a Ab aVb 
0 0 0 - 1 1 0 0 ] 
0 1 0 1 ] I 1 ] 





名 ”由 于 历史 原因 ， 我 们 仍 会 称 一 组 变量 的 “与 ”(“ 或 " ) 运算 为 积 (A). 





3-2 “ 非 ”运算 的 真 值 表 


a a a a 
0 l 1 0 





3.2 性 质 
从 公理 可 以 推导 出 布尔 表达 式 具 有 下 列 性 质 : 
交换 律 xAy=yAx, xVy=yVx 
结合 律 x A (y Nz) = (xAy) Az, xV (yVz) =(xVy) Vz 
分 配 律 aN\(yVz) =(xAy) V(xAz), wV(yAz)=(xVy)A(xVz) 
同一 律 x\x=x, xVx=x 
互补 律 z Ax =0, ` xVx=1 
吸收 律 xA (z Vy) =x, xV (xAy) =x 
组 合 律 (xAy) VCzA7) =x, (xVy) A(aVy) =x 
fs - 摩根 律 (xAy)=xVy, (xVy) =% Ay 
一 致 律 (wAy)V(wAz)V(yAz) = (xAy)V (x Az) 


(xVy)A(xVz) A(yVz) = (xVy)A(xVz) 
x 和 y 有 4 种 可 能 组 合 , x*、y 和 z 有 8 种 可 能 组 合 ， 验 证 这 些 组 合 的 有 效 性 ， 就 能 够 证 明 
这 些 性 质 。 例 如 ， 表 3-3 证 明 德 . 摩根 律 的 方法 在 数学 上 称 为 完全 归纳 法 (perfect induction) 。 


表 3-3 使 用 完全 归纳 法 证 明 德 . BRE 





x y (x Ay) xVy x y (xAy) xVy 
0 0 1 1 1 0 l l 
0 l I l 1 I 0 0 


这 里 仅仅 列 出 了 一 些 化 简 逻 辑 公 式 常 用 的 性 质 ， 还 有 许多 逻辑 公式 没有 列 出 来 。 
交换 律 和 结合 律 与 一 般 代数 的 交换 律 和 结合 律 相 同 。 在 “与 ”运算 或 者 “或 ”运算 中 ， 
参数 顺序 可 以 任意 交换 ， 两 个 及 两 个 以 上 输入 的 “与 ”运算 或 者 “或 ”运算 中 ， 参 数 可 以 任 
意 组 合 。 例 如 ,aAbAcAd 可 以 写成 (a 和 A5)A(cAd) 或 (d 人 (cA(bAa)))。 受 电路 延迟 约束 
和 现 有 逻辑 电路 库 的 限制 ， 这 两 种 形式 都 会 用 到 。 
分 配 律 与 一 般 代数 的 分 配 律 类 似 。 不 同 之 处 在 于 ,布尔 代数 中 可 以 把 “或 ”运算 分 配 到 
“与 ”运算 ,也 可 以 把 “与 ”运算 分 配 到 “或 ”运算 ， 而 一 般 代数 不 能 把 + 分 配 到 x 。 
同一 律 、 互 补 律 、 吸 收 律 和 组 合 律 与 一 般 代数 中 的 规则 有 所 不 同 。 这 些 性 质 在 化 简 公 式 时 
非常 有 有用。 例如， 化 简 逻 辑 函 数 : 
f(a,b,c) = (a À c) V (ë Ab A ey) V (@ Ab A e) V (a A b fe) (3-4) 
首先 ， 对 第 二 项 应 用 两 次 同一 律 ， 再 应 用 交换 律 ， 得 到 
f(a,b,c) =(& A ë) V (aá A b A é) V (a A bh A e) V (a Ab À e) 
V (€a NAb AcE) V(a AbAc) (3-5) 
其 次 ， 对 前 两 项 ” 应 用 吸收 律 ， 再 应 用 两 次 组 合 律 (对 第 3 和 4 项 应 用 一 次 组 合 律 ， 对 第 5 和 
6 项 应 用 一 次 组 合 律 )， 得 到 : 
flab) = (a A ey V (b A ey V (a Á b) (3-6) 
在 这 个 化 简 式 中 很 容易 得 到 这 样 的 结论 : 当 两 个 或 三 个 输入 变量 为 真 时 ， 择 多 函数 (majority 





O 细心 的 读者 会 发 现 ， 这 一 步 让 我 们 回 到 对 第 2 项 进行 复制 之 前 ， 但 是 这 里 证 明了 吸收 律 。 


[22 ] 








[23 ] 
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function) f(a,b,c) 为 真 。 
例 3-1 组 合 律 的 证 明 
这 里 使 用 完全 归纳 法 证 明 布 尔 表 达 式 的 组 合 律 性 质 。 
枚 举 所 有 可 能 的 输入 ,计算 每 个 函数 的 输出 ， 从 而 证 明 组 合 律 ， 如 表 3-4 所 示 。 
表 3-4 使 用 完全 归纳 法 证 明 组 合 律 


(xAy) V (xAy) x (xVy) A (xV5) 


0 








0 
0 0 
1 1 
1 l 


例 3-2 函数 的 化 简 
使 用 上 面 列 出 的 性 质 化 简 布 尔 表达 式 f(x,y) = (x 八 (yVx))V (xVy)， 化 简 过 程 如 下 : 
f(x,y) = (x À (y V z)) V VY) 
= ((x 人 y)V (x 人 3))V (xV3) ARE 


=((xAy¥) V 0) V (z V y) 互补 律 
=(xAy) V (x V >) 自 等 律 
= (x A y) V (x A y) > BRE 
= (x Á y) 同一 律 


3.3 ”对偶 函数 


在 逻辑 函数 /中 , 用 V 替换 和 人，V 替换 八 ，1 替换 成 0, 0 替换 成 1， 得 到 /的 对 偶 式 . 广 。 
例如 ， 如 果 


fla,b) = (a Ab) V (b Ac) (3-7) 
那么 
f’(a,b) = (a V b) A (b Ve) (3-8) 
对 偶 的 一 个 非常 重要 的 性 质 是 : 函数 的 对 偶 式 中 的 各 个 变量 取 补 等 于 函数 的 补 。 即 
f°(G,b,-) = 大 ai) (3-9) 


这 是 广义 德 . 摩根 律 ， 对 于 简单 的 “与 ”和 “或 ” 函数 同样 适用 。 4.3 节 中 我 们 利用 对 偶 开 关 
网 络 为 CMOS 门 构建 上 拉 网 络 时 会 用 到 这 个 性 质 。 
例 3-3 写 出 函数 的 对 偶 式 
E iH FA AG BAH MBX: 
f(x,y) = (1 A x) V (OV >) 
结果 如 下 : 
f? (ay) = (0 Vx) A (1 A y) 
表 3-5 说 明 公 式 (3-9) 对 特定 函数 有 效 ， 完 成 习题 3.6， 验 证 广义 德 * 摩根 律 的 普遍 性 。 
表 3-5 使 用 例 3-3 的 函数 验证 公式 (3-9) 


x 3 f? (x, 3) f (x, y) 
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3.4 标准 形式 

如 果 比 较 两 个 逻辑 表达 式 是 否 具有 相同 功能 ， 可 以 列举 每 一 个 可 能 的 输入 组 合 一 一 本 质 上 
是 填写 真 值 表 进行 比较 ， 更 简单 的 方法 是 把 两 个 表达 式 变 成 标准 形式 (normal form) 即 乘积 项 
之 和 进行 比较 。° 

例如 ,公式 (3-4) ~ 公式 (3-6) 表示 的 3 输入 择 多 函数 标准 形式 是 : 

fla,b,c) = (a Ab Ae) V(aAbAc) V(@AbAc)V(aANbAc) (3-10) 

逻辑 表达 式 标准 形式 的 每 一 个 乘积 项 对 应 函数 真 值 表 的 一 行 。 这 些 “ 与 ”表达 式 被 称 为 
最 小 项 〈(minterm) 。 在 标准 形式 里 ， 每 一 个 乘积 项 与 真 值 表 的 一 行 〈 最 小 项 ) 一 一 对 应 。 

对 每 个 输入 变量 使 用 自 等 律 ， 就 可 以 把 逻辑 表达 式 因 式 分 解 (factoring) ， 这 样 任意 逻辑 表 
达 式 都 可 以 转化 成 标准 形式 : 


F COS 9% 58°? ) = (x; A fx, ,°**,1,°°*,%,)) V (x; A f(x, ,***,0,°*,%,)) (3-11) 
例如 ， 使 用 这 种 方法 可 以 把 变量 a 从 公式 (3-6) 的 择 多 函数 中 分 解 出 来 : 

f(a,b,c) = (a A f(1,b,c)) V (a A f(0,b,c) ) (3-12) 

=(a\ (bVeV (bAc))) V (aA (bh ce)) (3-13) 

=(a Ab) V(a Ac) V(ahbAc) V (a Ab Ac) (3-14) 


对 5b 和 c 进行 展开 ， 最终 得 到 择 多 函数 的 标准 形式 ， 即 公式 (3-10), 
例 3-4 标准 形式 
写 出 下 面 公 式 的 标准 形式 : 
f(a,b,c) =a V (b À c) 
写 出 如 表 3-6 所 示 的 真 值 表 并 选择 所 有 最 小 项 ， 得 到 这 个 表达 式 的 标准 形式 如 下 : 
Ja,bc) = (@NbAc)V(aNbA®V(aNbAc) V(ahbAe)V(ahbAc) 


R3-6 例 3-4 HAR 


f (a, b, c) f (a, b, ë) 
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3.5 从 公式 到 门 电路 


我 们 经 常 使 用 逻辑 电路 图 (logic diagram) 表示 逻辑 函数 ， 即 用 连 线 连接 门 符号 组 成 的 原理 
图 。 图 3-1 是 三 种 最 基本 的 门 符号 。 每 个 门 左边 可 以 有 一 个 或 多 个 二 进 制 输入 ， 右 边 是 二 进 制 输 
出 。 与 门 (图 3-1a) 的 输出 是 所 有 输入 进行 “与 ”运算 的 结果 ， 即 c=aA2b。 图 3-1lb 所 示 的 或 
门 是 计算 所 有 输入 的 “或 "， 即 f=dVe。 反 相 右 (图 3-1c) 的 输出 为 单 输入 的 补 ， 即 h =&。 
与 门 和 或 门 可 以 有 多 个 输入 ， 反 相 器 一 般 是 单 输入 。 

使 用 这 三 个 门 符号 可 以 画 出 任意 布尔 表达 式 的 逻辑 电路 图 。 为 了 从 表达 式 转换 成 逻辑 电路 
图 ， 选 择 一 个 表达 式 顶 层 的 V 或 人 运算 符 ， 画 出 相应 类 型 的 门 。 使 用 参数 子 表 达 式 标 出 门 的 输 
人 ， 对 子 表达 式 重 复 此 过 程 。 


四” 积 之 和 标准 形式 被 称 为 合 取 范式 。 和 之 积 标准 形式 被 称 为 析 取 范式 。 由 对 偶 性 得 知 ， 积 之 和 标准 形式 等 价 于 
和 之 积 标准 形式 。 
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a d 
a) 与 门 b) 或 门 c) 反 相 器 
图 3-1 逻辑 符号 


例如 ， 公式 (3-6) 的 择 多 函数 的 欣 辑 电路 图 如 图 3-2 所 示 。 首 先 ， 把 位 于 顶层 的 两 个 V 
转化 为 3 输入 或 门 ， 并 放 在 输出 端 ， 这 个 或 门 的 输入 分 别 z 
ERE a Ab. a Ac 和 4bAc。 然 后 ,使 用 三 个 与 门 产生 这 b 
三 个 乘积 项 。 最 终 得 到 的 结果 是 计算 表达 式 f= (ab) V 
(a Ae) V(bAc) 的 逻辑 电路 。 

图 3-3a 是 异 或 (XOR) 函数 的 逻辑 电路 图 ,逻辑 功能 
是 当 只 有 一 个 输入 为 高 电 平时 ， 输 出 为 高 电 平 ( 即 有 且 仅 £ 
有 一 个 输入 为 高 电 平 ) : f= (a Ab) V (G Ab). 首先 ， 图 3-2 3 输入 择 多 函数 的 逻辑 电路 图 
使 用 两 个 反 相 器 分 别 产生 和 4。 然后 ,使 用 两 个 与 门 产 
生 两 个 乘积 项 a 入 b 和 a 人 5b5。 最 后 ,使 用 或 门 产生 最 终结 果 。 因 为 经 常会 用 到 异 或 函数 ， 所 以 
给 出 如 图 3-3c 所 示 的 异 或 门 符号 ， 同 时 也 给 出 在 逻辑 表达 式 中 使 用 的 异 或 符号 四 : a@b = 
(ab) V (ab), 

HE RA PA 3 22 88 Bae SAN 4b, PEHA (inversion bubble) 代替 反 相 
器 ， 如 图 3-3b 所 示 ， 它 的 功能 与 图 3-3a 的 功能 相同 。 这 样 就 使 用 了 更 简洁 的 符号 表示 a All b 
的 反 。 反 相 圈 可 以 放 在 门 的 输入 端 也 可 以 放 在 门 的 输出 端 。 不 管 放 在 哪里 ， 它 都 表示 信和 号 的 求 
反 。 把 反 相 圈 放 在 门 的 输入 端 相 当 于 输入 信号 连接 到 反 相 器 ， 其 输出 再 连接 到 门 的 输入 端 。 


a a 
b 
b b 


a) 使 用 反 相 器 的 逻辑 电路 图 b) 使 用 反 相 圈 的 多 辑 电 路 图 e) 门 符号 
图 3-3 异 或 函数 


反 相 圈 可 以 用 在 门 的 输出 端 和 输入 端 ， 如 图 3-4 所 示 。 一 个 与 门 后 面 连接 一 个 反 相 器 (图 3-4a 
等 价 于 一 个 在 输出 端 带 有 反 相 圈 的 与 门 (图 3-4b)。 根 据 德 . 摩根 律 ， 它 也 等 价 于 在 输入 端 带 
AIAR] (图 3-4c)。 这 个 门 实 现 了 函数 /= (a 人 5)， 即 与 非 门 的 功能 。 

一 个 或 门 后 面 连接 一 个 反 相 器 (图 3-4d) 的 情况 可 以 进行 类 似 变 化 。 使 用 反 相 圈 代 替 反 
相 器 得 到 或 非 符号 ， 如 图 3-4e 所 示 ， 应 用 德 . 摩根 律 得 到 另 一 种 或 非 门 符号 ， 如 图 3-4f 所 示 。 
因为 像 CMOS 这 样 的 常用 逻辑 系列 只 提供 了 带 反 相 功 能 的 门 ， 所 以 我 们 会 经 常 使 用 与 非 门 和 或 
非 门 基础 单元 ， 而 不 是 使 用 与 门 和 或 门 。 

图 3-5 说 明了 从 逻辑 电路 图 转化 成 公式 的 过 程 。 从 输入 开始 ， 用 公式 形式 标注 出 每 个 门 的 
输出 。 例 如 ,， 标 1 的 与 门 (与 -1) 计算 aAb, 或 -2 计算 cVd。 反 相 器 -3 对 aAb 求 反 得 到 
(a\b) =aVb。 注 意 ， 这 个 反 相 器 可 以 用 与 -4 输入 端的 反 相 圈 代 替 。 与 -4 的 输入 是 反 相 器 
的 输出 以 及 c Ald, 输出 为 (aV5)AcAd。 与 -5 的 输入 为 门 1 和 门 2 的 输出 ,输出 为 (c Vd) 
AaAb。 最 后 , 或 -6 的 输入 为 与 -4 和 与 -5 的 输出 ,输出 的 最 终结 果 是 ((aV 65) AcAd)V 
((cVd)AaÀAb). 
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d) 
图 3-4 ”与 非 门 和 异 或 门 : a) 一 个 与 门 后 面 连接 一 个 反 相 器 实现 了 与 非 函数 ; b) 用 一 个 反 相 

圈 代 替 反 相 器 得 到 与 非 符号 ; e) 应 用 德 . 摩根 律 得 到 与 非 的 替代 符号 ; d) 或 门 后 连 

接 一 个 反 相 器 实现 了 异 或 函数 ，e) 用 反 相 轿 代 蔡 反 相 器 得 到 异 或 符号 ; f) 应 用 德 . 

摩根 律 得 到 异 或 的 替代 符号 [48 | 









out 
(avb) ac adv ((evd)Aanb) 





cvd 
图 3-5 逻辑 电路 图 转化 成 公式 的 实例 


例 3-5 公式 转化 成 原理 图 
只 使 用 与 非 门 画 出 3 输入 择 多 函数 的 原理 图 。 
首先 ， 应 用 德 . 摩 根 律 ， 把 初始 函数 转化 成 使 用 与 非 门 的 函数 : 
f(a,b,c) = (a A b) V (a AÁA ey V (b Ac) 


=(a Ab) V (a Ac) V (b A o) 


=(a Ab) A(a Ac) A (b A co) 
使 用 3 输入 与 非 门 的 原理 图 如 图 3-6 所 示 。 
为 了 检验 这 个 结果 ， 把 遇 辑 电路 图 转换 成 公式 ， 首 先 ， 写 2 

















出 中 间 节 点 的 值 。 从 上 到 下 ， 它 们 分 别 是 4AB5、aAc 和 BAc， 最 f 
后 使 用 3 输入 与 非 门 得 到 初始 函数 : 
fla,b,c) = (a Ab) A (a Ac) A (b A c) 图 3-6 只 用 与 非 门 实现 择 多 函 


3.6 用 Verilog 描述 布尔 表达 数 ， 推 导 过 程 如 例 3-5 
本 书 中 ,将 使 用 硬件 描述 语言 Verilog 实现 数字 系统 。Verilog 代码 经 编译 、 仿 真 后 

载 到 现场 可 编程 门 阵列 (FPGA) 中 ， 也 可 综合 后 集成 到 芯片 中 。 本 节 将 介绍 如 何 用 Verilog 表 

示 逻 辑 表达 式 。 a 
Verilog 使 用 5、1、^ 和 -符号 分 别 表示 与 、 或 、 蜡 或 和 非 。 使 用 这 些 符号 ， 择 多 函数 公 

式 (3-6) 的 Verilog 表达 式 可 写成 如 下 形式 : 


assign out = (a & b)|(a & c)|(b & c) ; 


关键 字 assign 表明 这 个 语句 表示 的 是 组 合 逻 辑 函 数 ， 表 达 式 把 一 个 值 赋 给 信号 out ,语句 以 
分 号 (;) 结束 。 


34 PRD AD DH 








我 们 可 以 把 择 多 函数 门 声明 为 一 个 模块 (module), ， 如 图 3-7 所 示 。 前 面 3 行 声明 了 一 个 名 为 
Majority 的 模块 ， 输 入 为 a、b、c， 输 出 为 out。 然后 ， 插 入 assign 语句 来 定义 这 个 函数 。 

为 了 验证 择 多 函数 门 ， 这 里 用 Verilog 写 出 了 测试 脚本 (图 3-8)， 对 输入 变量 的 8 种 所 有 
可 能 组 合 进 行 模 拟 。 这 个 脚本 声明 了 一 个 3 位 寄存 器 count ， 用 这 个 寄存 器 驱动 三 个 输入 来 实 
例 化 择 多 模块 的 一 个 副本 ， 脚 本 还 声明 了 一 个 一 位 wire 类 型 的 输出 out 作为 模块 的 输出 端口 。 
initial 块 定义 了 一 组 模拟 开始 时 执行 的 语句 ， 这 些 语句 初始 化 count 为 0， 然 后 执行 8 次 
循环 来 显示 count 和 out 的 值 ， 然 后 count 加 1。 语句 枚 00 插入 100 个 单位 延 时 以 便 在 显示 
之 前 使 择 多 函数 门 输出 稳定 。 运 行 测 试 脚本 的 结果 如 图 3-9 所 示 。 


module Majority(a, b, c, out) ; 


input a, b, c ; 

output out ; 

assign out = (a & b)|(a & c)|(b & c) ; 
endmodule 





3-7 用 Verilog 描述 择 多 函数 门 


module test ; 
reg [2:0] count ; // 输入 一 一 3 位 计数 器 
wire out ; // 择 多 函数 的 输出 


// 实例 化 门 


Majority m(count [0] , count [1] , count [2] ,out) ; 


// 产生 8 个 输入 模式 
initial begin 
count = 3’b000 ; 
repeat (8) begin 
#100 
Sdisplay("in = %b, out = %b",count,out) ; 
count = count + 3’b001 ; 
end 
end 


endmodule 


图 3-8 择 多 函数 门 的 实例 化 和 测试 脚本 





例 3-6 Verilog 模块 
写 出 直接 与 下 面 择 多 函数 形式 相对 应 的 Verilog, 








f(a,b,c) = (a Ab) A (a Ac) A (b Ac) 
Verilog 模块 声明 与 图 3-7 相同 。 用 下 面 的 语句 代替 assign 84): 
assign out = ~((7 (a&b)) &(7 (a&c) ) &(~ (b&c))) ; 
注意 ， 择 多 函数 的 这 种 形式 可 读 性 比 图 3-7 所 示 的 形式 差 ， 但 是 也 
没 必 要 转化 表达 形式 ， 因 为 必要 时 综合 工具 会 自动 把 第 一 种 形式 转 图 3-9 图 3-8 所 示 测 试 
化 成 第 二 种 形式 。 脚本 的 输出 
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小 结 


本 章 学 习 了 布尔 代数 的 基本 知识 ， 布 尔 代 数 只 有 元 素 0 和 1 以 及 三 种 运算 符 人 A、V 和 
NOT。 布尔 代数 常用 来 分 析 数 字 逻 辑 ， 它 使 用 这 些 运 算 符 在 0 和 1 上 进行 运算 。 

布尔 代数 有 3 个 公理 : 自 等 律 、0 -1 律 、 否 定律 。 根 据 这 3 个 公理 ， 可 以 推导 出 包括 交换 
律 、 结 合 律 、 分 配 律 和 德 ， 摩根 律 在 内 的 许多 有 用 的 性 质 ， 使 用 这 些 性 质 可 以 操作 布尔 代数 中 
的 公式 。 为 了 比较 布尔 函数 ， 可 以 把 它们 转化 成 标准 形式 ， 即 最 小 项 之 和 ， 最 小 项 是 包含 所 有 
输入 变量 的 乘积 项 。 

布尔 代数 具有 对 偶 性 。 函 数 的 对 侦 式 可 以 用 八 蔡 换 V 、V 替换 人 、! 替换 0、0 替换 1 得 到 。 


函数 的 对 偶 式 具有 如 下 性 质 : / (a,8,…) =f/(a,b,…)。 例 如 ，a Ab 的 对 偶 式 为 cV0，aAD = 
aV bs s 

使 用 图 3-1 所 示 的 门 符 号 替换 函数 中 的 A、V 和 NOT， 布 尔 函 数 可 以 表示 为 门 级 电路 。 在 
图 中 可 以 用 反 相 图 表示 NOT。 我 们 还 可 以 根据 每 个 门 从 输入 到 输出 形成 的 部 分 表达 式 ， 将门 级 
电路 图 转换 成 与 之 对 应 的 公式 。 

在 Verilog 中 ， 可 以 使 用 assign 语句 表示 布尔 也 数 ， 用 & d A, | 替换 V ，~ 替换 
NOT. Sth Verilog 表达 式 后 ， 就 能 模拟 一 个 布尔 函数 ， 还 可 以 把 它 封 装 为 一 个 模块 ， 用 这 个 模 
块 构建 更 复杂 的 函数 。 


文献 说 明 


在 19 世纪 中 期 ,乔治 布尔 (George Bode) 系统 阐述 了 布尔 逻辑 ， 并 在 两 篇 文章 中 介绍 
了 他 的 研究 成 果 。 现 在 ， 这 两 篇 文章 可 以 从 网 上 免费 获得 [12] [13]。 德 .摩根 在 1860 年 的 
文章 中 描述 了 许多 逻辑 公式 [35]. 
习题 
3.1 证 明 吸收 律 。 使 用 完全 归纳 法 〈 即 列举 所 有 可 能 的 输入 状态 ) 证 明 吸收 律 性 质 为 真 。 
3.2 证 明 同一 律 。 使 用 完全 归纳 法 证 明 同 一 律 性 质 为 真 。 
3.3 证 明 结合 律 。 使 用 完全 归纳 法 证 明 结 合 律 性 质 为 真 。 
3.4 证 明 分 配 律 。 使 用 完全 归纳 法 证 明 分 配 律 性 质 为 真 ， 无 论 人 分 配 到 V ， 还 是 V 分 配 到 人 都 为 真 。 
3.5 “或 ”运算 和 “与 ”运算 不 是 一 般 代数 中 的 + 和 x。 证 明 分 配 律 性 质 不 适用 于 整数 中 把 + 分 配 到 x 。 
3.6 德 . BARE, 1. X 
whxANyAz=wVkVyViz 
和 
wVxVyVz=zwAxANy Az 
使 用 完全 归纳 法 证 明 4 变量 德 . 摩根 律 。 
3.7 德 . 摩根 律 ，I[ 。 连 续 应 用 德 - 摩根 律 把 逻辑 函数 转化 成 标准 形式 ， 从 而 证 明 公式 (3-9) 为 真 。 
3.8 化 简 布 尔 公式 ，I 。 把 下 面 布尔 表达 式 中 的 文字 数量 降 到 最 少 : 
(x V y) A(x V y) 
3.9 化 简 布 尔 公 式 ， 开 。 把 下 面 布尔 表达 式 中 的 文字 数量 降 到 最 少 : 
(xNyAz)V Ce Ay) V(x Ax Az) 
3.10 化 简 布尔 公式 ， 亚 。 把 下 面 布尔 表达 式 中 的 文字 数量 降 到 最 少 : 
(iy Az) V (x Aw)) A ((x A y) V (z Aw)) 
3.11 化 简 布 尔 公式 ，K 。 把 下 面 布尔 表达 式 中 的 文字 数量 降 到 最 少 : 
(x Ay) V (x A ((w Az) V (w A z))) 
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3. 23 


3.24 


3. 25 


3. 26 


3.27 


3. 28 


3.29 





化 简 布尔 公式 ，V 。 把 下 面 布尔 表达 式 中 的 文字 数量 降 到 最 少 : 
(wAzAy)V (wNKAY Az) V (wAxAyA 2z) 
对 偶 函 数 ， 工 。 找 出 下 列 函 数 的 对 偶 函 数 并 写 出 其 标准 形式 : 
fen = (w A y) V (š À y) 
xm Bae, H. fh F7 RRIAK RKO S HU HAREE: 
J(x,y,z) = (x Ay) V (z Az) V (y A z) 
a4 Hse, Mo Ri FIRIR RRO H HEREJE: 
Kaya) = la N ((y Az) V (y Az))) V (g A ((y A z) V (y Az))) 
标准 形式 ， 工 。 写 出 下 列 布尔 表达 式 的 标准 形式 : 
f(x,y,z) = (x A y) V (x Az) 
标准 形式 ， 卫 。 写 出 下 列 布尔 表达 式 的 标准 形式 : 
Axiy) = x 
标准 形式 ， 亚 。 写 出 下 列 布 尔 表达 式 的 标准 形式 : 

J(z,y,z) = (x A ((y Az) V (y Az))) V (z A ((y Az) V (y Az))) 
WEER, N. Si FABRA HEE: 如 果 有 0 个 或 2 MAW IMS (x, y, z) =1。 
根据 原理 图 写 出 公式 ， 工 。 根 据 图 3-10a 所 示 的 逻辑 电路 写 出 化 简 后 的 布尔 表达 式 。 
根据 原理 图 写 出 公式 ， 开 。 根 据 图 3-10b 所 示 的 逻辑 电路 写 出 化 简 后 的 布尔 表达 式 。 
根据 原理 图 写 出 公式 ， 亚 。 根 据 图 3-10c 所 示 的 逻辑 电路 写 出 化 简 后 的 布尔 表达 式 。 


x 
x 
x y > £ 
£ = f 
J Z 
a) b) c) 
图 3-10 习题 3.20. 2JEH 3.21 和 习题 3. 22 的 逻辑 电路 


根据 公式 画 出 原理 图 ， 工 。 为 下 列 未 化 简 的 逻辑 公式 画 出 原理 图 : 
fxsys2) = (w Ny Az) V (s Ay Az) V (x A y A 2) 

根据 公式 画 出 原理 图 ， 开 。 为 下 列 未 化 简 的 逻辑 公式 画 出 原理 图 : 

S(%,y,2z) = ((x Ay) V z) A (x À z) 

根据 公式 画 出 原理 图 ， 焉 。 为 下 列 未 化 简 的 逻辑 公式 画 出 原理 图 : 


f(x y z) = (w Ñ z) Viz 
根据 公式 画 出 原理 图 ，IK 。 为 下 列 未 化 简 的 逻辑 公式 画 出 原理 图 : 如 果 有 1 个 或 2 个 输入 为 1 
Wf (x, y, zy =l 
Verilog。 写 出 实现 下 列 逻辑 功能 的 Verilog 模块 ; 
Kay) = (*< Ax) V (z Nz) 
编写 一 个 测试 脚本 验证 模块 在 x、y、z 的 8 种 组 合 上 的 运算 ， 写 出 此 电路 实现 的 功能 。 
逻辑 公式 。 
(a) 根据 图 3-11 所 示 电 路 ， 写 出 未 化 简 的 逻辑 公式 。 
(b) 写 出 此 函数 未 化 简 的 对 偶 式 。 a 
(c) 根据 未 化 简 的 对 偶 式 画 出 电路 。 ó 
(d) 化 简 原 始 公式 。 
(e) 请 解释 : 在 原始 电路 中 ， 如 何 利用 反 相 器 和 最 后 一 个 
或 门 化 简 原始 公式 。 
选择 一 种 表示 法 。 检 查 三 张 扑 克 牌 是 否 同一 花色 ( 即 都 是 图 3-11 习题 3. 28 的 逻辑 电路 
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红 桃 ， 都 是 黑 桃 ， 都 是 方块 或 者 都 是 梅花 ) 。 三 种 表示 法 (a) (b), (c) 中 ， 哪 种 表示 法 需要 的 
门 输 入 端 数 最 少 ? 为 了 回答 这 个 问题 ， 我 们 假设 一 个 异 或 门 与 三 个 基本 门 的 成 本 相同 ， 例 如 ， 一 
个 2 输入 异 或 门 与 一 个 门 输入 端 数 为 6 的 基本 门 成 本 相同 。 
(a) 用 一 个 4 位 独 热 码 表 示 花 色 。 独 热 码 是 只 有 1 位 为 1， 其 余 的 位 全 为 0 的 一 种 码 制 。 例 如 ， 梅 
花 可 以 表示 为 0001 ， 黑 桃 可 以 表示 为 0010, 方块 表示 为 0100， 红 桃 表示 为 1000, 
(b) 用 一 个 2 位 格雷 码 表示 花色 。 格 雷 码 的 解释 在 习题 1.9 中 。 可 以 用 00 表示 梅花 ，01 表示 黑 
桃 ， 等 等 。 
(e) 用 一 个 3 位 数 表示 花色 。 这 个 3 位 数 可 以 是 独 热 码 也 可 以 是 0。 编 码 可 以 是 0 (000) 或 集合 
(001, 010, 100), 
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Digital Design: A Systems Approach 


CMOS 逻辑 电路 





本 章 主要 介绍 如 何 使 用 互补 金属 氧化 物 半导体 (CMOS) 蝇 体 管 构 建 逻 辑 电 路 ( 门 )。 从 
4.1 节 开始 ， 介 绍 如 何 使 用 开关 实现 逻辑 功能 ， 串 联 开关 组 合 实 现 “ 与 ”功能 ， 并 联 开关 组 合 
实现 “或 ”功能 。 通 过 构建 复杂 的 串 -并 联 开关 网 络 可 以 实现 更 复杂 的 开关 逻辑 功能 。 

在 4.2 节 中 ， 介 绍 了 一 个 非常 简单 的 MOS 晶体管 的 开关 级 模型 。CMOS 晶体 管 分 为 两 种 
类 型 : NMOS 和 了 PM0S。 为 了 分 析 逻 辑 电路 的 功能 ， 我 们 把 NMOS 晶体 管 看 成 是 一 个 开关 ， 
当 栅 极 是 逻辑 “1” 时 ,开关 闭合 ， 是 逻辑 “0” 时 ,开关 断 开 。PMOS mik- NMOS mik 
管 相 反 一 一 当 栅 极 是 逻辑 “0” 时 ， 开 关闭 合 ， 人 逻辑 “1” 时 ,开关 断 开 。 为 了 模拟 逻辑 电路 
的 延迟 和 功率 (第 5 章 将 会 提 到 ) ， 我 们 会 在 基本 开关 上 增加 一 个 电阻 和 电容 。 开 关 级 模型 比 
用 于 MOS 电路 设计 的 模型 简单 ， 但 是 足以 用 它 来 分 析 数 字 人 逻辑 电路 的 功能 和 性 能 。 

在 4.3 节 中 ,我 们 将 应 用 开关 级 模型 ， 学 习 如 何 使 用 一 个 NMOS 下 拉 网 络 和 一 个 互补 的 
PMOS 上 拉 网 络 构建 门 电 路 。 例 如 ,用 NMOS 晶体 管 的 串联 下 拉 网 络 和 PMOS 晶体 管 的 并 联 上 
拉 网 络 实现 一 个 与 非 门 。 


4.1 开关 逻辑 

在 数字 系统 中 ,我 们 使 用 二 进 制 变量 表示 信息 并 使 用 由 这 些 变 量 控制 的 开关 处 理 信息 。 
图 4-1 是 一 个 简单 的 开关 电路 ， 当 二 进 制 变 量 a 为 假 (0) 时 ， 如 图 4-1a 所 示 ， 开 关 断 开 ， 灯 
WR. Ma 为 真 (1) 时 ,开关 闭合 ,电路 中 电流 通过 ,灯泡 点 亮 (图 4-1b)。 


a) b) 
图 4-1 逻辑 变量 a 控制 连接 电压 源 和 灯泡 的 开关 。a) 当 a =0 时 ,开关 断 开 ， 灯泡 熄灭。 
b) 当 a =1 时 ,开关 闭合 ， 灯 泡 点 亮 

如 图 4-2 所 示 ， 可 以 用 开关 网 络 实现 简单 逻辑 。 这 里 ， 为 了 清晰 ， 省 略 了 电压 源 和 灯泡 ， 
但 是 我 们 仍然 认为 当 两 端 连通 时 ， 开 关 网 络 为 真 ， 此 时 如 果 连 接 了 灯泡 ， 那么 灯泡 点 亮 。 

假设 要 构建 一 个 开关 网 络 ， 其 功能 为 : 只 有 当 两 个 开关 (由 负责 人 控制 ) 都 闭合 时 才 会 
发 射 导弹 。 图 4-2a 所 示 的 开关 网 络 可 以 实现 此 功能 ， 把 两 个 开关 串联 ， 并 由 变量 a 和 46 分别 控 
制 两 个 开关 。 为 了 清晰 ,经常 省 略 开 关 符 号 ， 用 断 开 的 导线 表示 开关 ， 并且 使 用 控制 开关 的 变 
量 标 记 ， 如 图 所 示 。 当 且 仅 当 a Ab 都 为 真 时 ， 两 端 才 连接 起 来 。 这 样 就 可 以 确定 只 有 当 a 和 
b 都 同意 发 射 时 ， 才 会 发 射 导弹 。a nk b 都 能 通过 断 开 开关 停止 发 射 导弹 。 这 个 开关 网 络 实现 
TH RB f=a Ab. 

在 发 射 导 弹 之 前 ， 要 确保 每 个 人 都 同意 发 射 ， 因 此 使 用 “与 ”功能 。 另 一 方面 ， 当 停止 火车 


O 在 第 3 章 中 ， 人 表示 2 变量 的 逻辑 “与 ”运算 ，V 表 示 2 变量 的 逻辑 “或 ”运算 。 
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= N 
f=anb f=avb 
a) b) 
图 4-2 实现 “与 ”运算 和 “或 ”运算 的 开关 电路 。a) BIRGER, MARRE a 和 
b 都 为 走时 (aA5) ， 电 路 闭合 。b) 两 个 开关 并 联 ， 任 一 逻辑 变量 为 真 时 (a Vb), 
电路 闭合 。 为 了 清晰 ， 经 党 省 略 开关 符号 ， 只 标明 逻辑 变量 
时 ， 任 何 一 个 人 发 现 问题 时 都 可 以 使 用 刹车 ， 在 这 种 情况 下 ， 使 用 “或 ”功能 ， 如 图 4-2b 所 示 。 
由 二 进 制 变量 a 和 6 分 别 控制 两 个 并 联 开关 ， 当 a 和 6 之 一 为 真 或 a。 和 都 为 真 时 ， 开 关 网 络 
的 两 端 相连 ， 这 个 网 络 实现 了 函数 六 = aV 4。 
利用 串联 和 并 联网 络 可 以 实现 任意 逻辑 函数 。 例 如 ， 
图 4-3 所 示 的 网 络 实现 了 函数 /= (a Vb) Ac 为 了 使 网 L, He savne 
络 的 两 端 相连 ，e DAW, TE a 和 4 之 一 必须 为 真 。 
例如 ， 在 汽车 的 启动 装置 上 会 用 到 这 样 的 电路 ， 如 果 铀 
是 转动 c 时 ， 踩 下 离合 或 者 变速 器 在 空挡 位 置 5， 那么 
就 可 以 启动 汽车 。 
能 实现 相同 逻辑 功能 的 开关 网 络 不 止 一 个 。 例 如 ， 图 4-4 是 两 个 不 同 的 网 络 ， 但 它们 都 实 
现 了 3 输入 择 多 函数 。 如 果 输入 都 为 真 ， 择 多 函数 返回 真 ， 如 果 至 少 2 个 输入 为 真 ， 此 函数 也 
为 真 。 两 个 网 络 都 实现 了 逻辑 函数 /= (a Ab) V (a Ae) V (5bAe)。 


a b 
= | H f=(arb)v(anc)v (bac) 
b g c 
) b) 
a 


图 4-4 3 输入 择 多 函数 (或 三 分 之 二 函数 ) 的 两 种 实现 方法 ， 当 3 个 输入 中 至 少 有 2 个 输入 
为 真 时 ， 函 数 为 真 

分 析 开 关 网 络 实现 的 功能 有 很 多 方法 。 一 种 方法 是 列举 n 个 输入 的 2" 种 组 合 ， 从 而 确定 
网 络 连通 时 的 组 合 ; 还 有 一 种 方法 就 是 确定 两 端 之 间 的 所 有 路 径 ， 然 后 根据 路 径 确定 变量 集 
合 ， 如 果 集 合 中 的 变量 为 真 ， 则 函数 为 真 。 对 于 串 - 并 联网 络 ， 把 串联 或 并 联 的 开关 组 合用 一 
个 开关 替换 ， 开关 由 “与 ”或 者 “或 ”的 开关 表达 式 控 制 ， 这 样 ， 有 时 可 以 化 简 网 络 。 

图 4-5 显示 了 如 何 用 替换 的 方法 分 析 图 4-4a 所 示 的 网 络 。 初 始 网 络 如 图 4-5a 所 示 。 首 先 ， 
合并 标 有 8 Alc 的 并 联 分 支 ， 合 并 为 标 有 4Ve 的 单一 开关 (图 4-5b)。 然 后 ， 5 人 Ac Bb Me 
的 串联 组 合 (图 4-5c)。 图 4-5d rh, Ha A (b Ve) RERA a MaN Ve) 的 开关 。 接 着 ， 
两 个 并 联 分 支 合 并 成 [a 和信 (bVc)] V(bAc) (图 4-5e)。 如 果 把 a 人 (bVc) 展开 ， 就 会 得 到 如 
图 4-5f 所 示 的 最 终 表达 式 。 

到 目前 为 止 ， 我 们 在 网 络 中 仅 使 用 了 正 开 关 。 当 相关 逻辑 变量 或 表达 式 为 真 (1) PF, FF 
关闭 合 ， 这 样 的 开关 称 为 正 开 关 。 利 用 正 开 关 仅 能 实现 单调 递增 函数 ， 为 了 实现 所 有 函数 ， 就 





图 4-3 一 个 实现 “或 -与 ”运算 的 开 
关 网 络 ， 它 实现 函数 (aVb) Ac 
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b c c bve 
a) b) c) 
aalbvc) bac caches (anb)v(anc)v6 ac) 
d) e) f) 


图 4-5 GFE tB kakak A HRM — PIF, PIE H Eh 09 g 3 NH Hil, Z 
过 多 次 重复 替换 ， 就 可 以 分 析 任 何 串 -并 联 开关 网 络 
需要 引入 负 开关 一 一 当 开 关 的 逻辑 控制 变量 为 假 (0) 时 ， 开 关闭 合 ， 如 图 4-6a 所 示 。 我 们 使 
用 控制 变量 上 加 撤 号 a' 或 上 横 线 & 表 示 负 开关 ， 这 两 种 表示 方法 都 表明 : 当 为 假 (0) 时 ， 
开关 闭合 。 我 们 可 以 构建 正 负 开 关 同 时 存在 的 逻辑 网 络 。 例 如 ， 图 4-6b 实现 了 函数 /=a 人 5。 
经 常会 出 现 同时 控制 具有 相同 逻辑 变量 的 正 负 开关 ， o 





例如 ， 图 4-7a 实现 了 2 输入 的 异 或 (XOR) 函数 。 如 果 ° ° 
a 为 真 , b NR, Ee LMM RAS, WME a 为 假 , b — — 
为 真 ， 那 么 电路 下 面 的 分 支 闭合 ， 这 样 ， 当 a 和 4 之 一 为 
真 时 ， 这 个 网 络 闭合 (为 真 )， 当 a 和 同时 为 真 或 同时 图 46 MERCEARIAS a 或 上 
为 假 时 ， 这 个 网 络 断 开 (为 假 ) 。 oe Soe 


开关 网 络 闭合 (A). b) 实 


使 用 过 走廊 或 楼 梯 灯 的 人 都 会 非常 熟悉 这 样 一 个 电 vette ee 


路 ， 灯 由 两 个 独立 的 开关 控制 ， 分 别 在 走廊 或 楼 梯 的 两 
端 ， 改 变 任何 一 个 开关 的 状态 都 可 以 改变 灯 的 状态 。 实 际 上 ， 每 个 开关 包含 两 个 开关 一 一 一 个 
正 开关 和 一 个 负 开 关 ， 它们 由 相同 变量 控制 : 开关 的 位 置 。? 开 关 接 线 情况 如 图 4-7 所 示 ， 开 关 
a 和 忆 在 走廊 的 一 端 b Ab 在 另 一 端 。 

有 时 ， 我 们 希望 能 够 在 长 长 的 走廊 中 间 控 制 灯 ， 就 像 在 走廊 尽头 控制 灯 一 样 。 一 个 3 输入 异 
或 网 络 可 以 实现 这 个 功能 ， 如 图 4-7b 所 示 。 当 奇数 个 输入 为 真 时 , n 输入 异 或 函数 为 真 。 如 果 输 
和 人 a、b、c 之 一 为 真 或 三 者 都 为 真 时 ,3 输入 异 或 网 络 闭合 。 这 个 结论 可 以 通过 列举 a. b. c 的 8 
种 组 合 ， 也 可 以 通过 跟踪 路 径 来 证 实 。 但 是 ， 不 能 如 图 4-5 那样 进行 替换 来 分 析 网 络 ， 因 为 它 不 
是 一 个 串 -并 联网 络 。 如 果 对 分 析 非 串 - 并 联网 络 感 兴趣 ， 可 以 参考 习题 4 1 和 习题 4. 2。 

在 走廊 应 用 中 ,与 a 和 < 相关 的 开关 被 放 在 走廊 的 一 端 ， 与 5 相关 的 开关 放 在 走廊 的 中 
间 。 如 果 想 要 增加 更 多 的 开关 来 控制 相同 的 灯 ， 可 以 重复 开关 5b 的 4 开关 模式 多 次 ， 每 次 都 由 
不 同 变 量 控制 .9 
例 4-1 串 一 并 联网 络 

绘制 并 化 简 一 个 串 - 并 联网 络 ， 实 现 如 下 功能 : 如果 doba 是 一 个 合法 的 温度 计 编 码 





O 电子 工程 师 称 具 有 3 端 2 开关 的 单元 为 3 路 开关 。 

O 电子 工程 师 称 具有 4 端 4 开关 的 单元 为 4 路 开关 ， 当 变量 为 假 时 (开关 向 下 拨 动 )， 是 直通 连接 ， 变 量 为 真 时 
(开关 向 上 拨 动 )， 为 交叉 连接 。 为 了 控制 具有 n (大 于 等 于 2) 个 开关 的 灯 需 要 使 用 2 个 3 路 开关 和 nn-2 个 4 
路 开关 。 当 然 ， 把 4 路 开关 的 一 端 不 接 时 ， 可 以 用 作 3 路 开关 。 
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a) b) 
4-7 当 奇 数 个 输入 为 真 时 ， 异 或 (XOR) 开关 网 络 为 真 (闭合 ) a) 2 输入 异 或 网 络 。 
b) 3 输入 异 或 网 络 

(0000, 0001, 0011, 0111, 1111), ABA žžk f(d,c,b,a) =1。 

图 4-8 是 解 题 步骤 。 首 先 ， 画 出 5 个 最 小 项 并 联 在 一 起 的 网 络 ， 如 图 4-8a Pf F. HK, M 
最 左边 的 两 列 消除 不 必要 的 变量 d， 从 最 右边 的 两 列 消除 不 必要 的 变量 w。 最 后 ， 把 并 联 的 两 
个 分 支 中 与 < 和 dA 人 i 都 相连 的 a 人 b 提 取出 来 形成 一 条 路 径 。 注 意 ， 在 图 4-8c 中 不 能 合并 两 个 
dA 人 5， 因 为 这 样 做 会 产生 不 合法 的 路 径 c 人 Bb。 

为 了 验证 串 -并 联网 络 图 4-8c 能 实现 题目 要 求 ， 我 们 可 以 用 公式 表示 图 4-8c 所 示 的 功能 。 
推导 过 程 如 图 4-8d ~ 图 4-8f。 最 终 得 到 下 列 等 式 : 

f(d,c,b,a) = ((c V (dAe)) Ab Aa) V (ATAD) 

这 是 原始 函数 的 另外 一 种 表达 形式 ， 同 时 也 证 明了 此 网 络 图 的 正确 性 。 
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图 4-8 例 4-1 的 解决 方案 。a) ~e) 对 最 初 的 串 - 并 联网 络 反复 推导 。d) ~f) 推出 e) 所 示 的 
布尔 表达 式 


4.2 MOS 晶体 管 的 开关 模型 


在 构建 现代 数字 系统 时 常 使 用 CMOS (互补 氧化 金属 半导体 ) 场 效应 晶体 管 作为 开关 。 
图 4-9 是 一 个 MOS 晶体 管 的 物理 结构 和 电路 符号 。MOS 晶体 管用 半导体 作为 衬 底 ， 并 有 3 个 
接线 端 ” : 栅 极 、 源 极 和 漏 极 。 源 极 和 漏 极 都 是 在 衬 底 上 扩散 杂质 形成 的 。 栅 极 由 多 晶 硅 组 
成 ， 栅 极 与 衬 底 间 绝缘 ， 中 间 是 一 层 薄 薄 的 氧化 层 。MOS 这 个 名 称 是 使 用 金属 〈 铝 ) 作为 栅 
极 材 料 时 沿用 下 来 的 ， 指 的 是 栅 极 层 (金属 ) 、 栅 极 氧化 层 〈 氧 化 ) 和 衬 底 (`e dk). 

图 4-9d 是 MOSFET 的 俯视 图 ， 图 中 给 出 了 器 件 的 宽度 友和 长 度 工 ， 电 路 或 逻辑 设计 者 通 
过 调整 二 者 的 尺寸 来 确定 晶体 管 的 性 能 o WREKE LERT (FRAN) 必须 经 过 的 从 
源 极 到 漏 极 的 距离 ， 因 此 工 直接 关系 到 器 件 的 速度 。 通 常 提 到 半导体 工艺 就 是 指 半 导体 栅 极 长 
度 ， 由 此 看 出 栅 极 长 度 是 很 重要 的 参数 。 例 如 ， 现 在 (2012) 的 最 新 设计 实现 了 28 nm CMOS 
的 工艺 ( 即 具有 最 小 栅 极 长 度 28 nm 的 CMOS 工艺 ) 。 几 乎 所 有 的 逻辑 电路 都 使 用 了 这 个 工艺 
中 的 最 小 栅 极 长 度 ， 这 样 的 器 件 速度 最 快 ， 功 耗 最 低 。 


衬 底 是 第 4 个 接线 端 ， 这 里 忽略 它 。 

一 些 先 进 的 工艺 又 重新 把 金属 作为 制作 栅 极 的 材料 。 

栅 极 氧化 层 的 厚度 也 是 一 个 关键 的 尺寸 ， 它 只 能 由 工艺 设 定 ， 而 不 能 由 设计 者 决定 。 与 此 不 同 的 是 ， WW 和 上 
由 掩 膜 决定 ， 因 此 设计 者 可 以 调节 。 
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沟 道 宽度 不 决定 器 件 的 强度 ， 顺 件 越 宽 ， 并 行 穿 过 器 件 的 载 流 子 越 多 。 四 值 越 大 ， 唱 体 
管 的 导 通 电阻 越 小 ， 电 流 越 大 ， 负 载 电 容 放电 会 更 快 ， 从 而 使 器 件 速度 更 快 ， 但 是 随 着 WW 的 
增加 ， 器 件 栅 极 电容 也 会 增加 ， 从 而 会 延长 器 件 栅 极 的 充 放 电 时 间 。 

图 4-9c 是 n- 沟 道 MOSFET (NFET) 和 p- 沟 道 MOSFET (PFET) 的 电路 符号 。 在 NFET 中 ， 
源 极 和 漏 极 是 在 p 型 衬 底 中 的 n 型 半导体 ， 载 流 子 是 电子 。 在 PFET 中 则 相反 一 一 源 极 和 漏 极 
是 在 n 型 衬 底 中 的 p 型 半导体 Cn 型 衬 底 通常 是 指 通过 扩散 工艺 在 P 型 衬 底 上 形成 的 mn 阱 )， 
载 流 子 是 空 穴 。 如 果 你 现在 不 知道 什么 是 n 型 半导体 、p 型 半导体 、 空 穴 、 电 子 、 不 用 担心 ， 
后 面 我 们 会 介绍 这 些 名 词 。 





栅 极 氧化 层 





9) d) 
图 4-9 一 个 MOS 场 效 应 晶体 管 (FET) 有 3 个 接线 端 。 当 器 件 导 通 时 ， 电 流通 过 源 极 和 漏 极 
〈 相 同类 型 的 接线 端 ) ， 栅 极 上 的 电压 控制 器 件 导 通 还 是 截止 。a) 去 掉 衬 底 后 MOS- 
FET 的 结构 图 。b) MOSFET 的 侧 视图 。c) n- 沟 道 FET (NFET) 和 p-? iff FET 
(PFET) 的 电路 符号 。d) MOSFET 的 俯视 图 ， 显 示 了 MOSFET 的 宽度 W AKEE L 


图 4-10 是 一 个 简单 的 n- 沟 道 FET 数字 模型 的 操作 。 如 图 4-10a 所 示 ， 当 NFET 的 栅 极 是 
逻辑 0 时 ,一 对 p -an 结 ( 背 对 背 二 极 管 ) 使 源 极 和 漏 极 彼此 绝缘 ， 因 此 从 漏 极 到 源 极 没有 电 
Ti, L. =0。 中 间 部 分 的 电路 符号 反映 了 这 种 情况 。 我 们 用 一 个 断 开 的 开关 模拟 NFET 的 这 种 
状态 ， 如 最 下 面 的 图 所 示 。 

当 栅 极 是 逻辑 1 而 且 源 极 是 逻辑 0 时 ， 如 图 4-10b 所 示 ，NFET 导 通 。 栅 极 和 源 极 之 间 的 
正 向 电压 使 沟 道 (channel) 中 负电 荷 向 栅 极 下 面 聚 集 。 这 些 负载 流 子 (电子 ) 的 存在 使 沟 道 
称 为 n- 型 ,而且 在 源 极 和 淖 极 之 间 形 成 了 一 个 导电 区 域 。 漏 极 和 源 极 之 间 的 电压 加 速 了 沟 道中 
的 载 流 子 的 运动 ， 从 而 形成 了 从 漏 极 到 源 极 的 电流 1js。 中 间 的 图 是 NFET 的 电路 图 。 下 面 的 图 
是 NFET 导 通 的 开关 模型 。 当 栅 极 是 1， 源 极 是 0 时 ， 开 关闭 合 。 


加 HF MOSFET 操作 的 详细 讨论 已 经 超出 本 书 的 范围 ， 详 细 内 容 请 查阅 半导体 器 件 相 关 教 材 。 
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图 4-10 一 个 n- 沟 道 MOSFET 的 简单 工作 原理 。a) 当 顶 极 和 源 极 电压 相等 时 ， 由 于 p -an 结 
(一 个 二 极 管 ) 处 于 反 相 ， 所 以 器 件 中 没有 电流 通过 。b) 当 在 栅 极 施加 正 电压 时 ， 
电压 使 沟 道中 的 负载 流 子 向 栅 极 下 面 聚 集 ， 使 该 区 域 由 p- 型 硅 转变 为 n- 型 硅 ， 从 而 
把 源 极 和 漏 极 连接 起 来 , 产生 了 电流 fs。 上 面 的 图 显示 了 器 件 物理 上 的 变化 。 中 间 
的 图 显示 了 电路 示意 图 。 下 面 的 图 显示 了 器 件 的 开关 模型 


注意 源 极 是 否 为 1 很 重要 ， 当 源 极为 1 时 ， 即 使 机 极为 1， 开 关 也 不 是 闭合 状态 ， 因 为 
在 栅 极 和 源 极 之 间 没 有 净 电 压 来 感应 沟 道 电荷 。 这 种 情况 下 ， 开 关 也 不 是 断 开 状态 ， 因 为 开关 
闭合 与 否 取决 于 栅 极 和 漏 极 电压 是 否 下 降 到 电压 1 以 下 的 闽 值 电压 。 当 源 极 =1 并 且 栅 极 =1 
时 ，NFET 处 于 未 定义 状态 (从 数字 角度 而 言 )。 最 终结 果 是 NFET 只 能 可 靠 传输 逻辑 0 信号 ， 
传输 逻辑 1 需要 PFET, 

PFET 的 操作 说 明 如 图 4-11 所 示 ， 与 NFET 类 似 。 区 别 在 于 PFET 源 极 电 平 较 高 ， 而 漏 极 较 
低 ，NFET 源 极 电 平 较 低 ， 而 漏 极 较 高 。 对 于 PFET， 当 栅 极 为 0 源 极 为 1 时 ， 器 件 导 通 ， 当 栅 
极为 1， 源 极为 1 时 ， 器 件 截 止 。 当 栅 极 为 0 
且 源 极为 0 时 ， 器 件 处 于 未 定义 状态 。 因 为 器 
件 可 靠 导 通 时 ， 源 极 必须 为 1， 所 以 PFET H 
能 可 靠 传输 逻辑 1. W NFET Ej PFET 形成 互 
补 ， 只 能 传输 0。 

图 4-10 和 图 4-11 所 示 的 NFET 和 PFET 
模型 精确 地 模拟 了 大 多 数 数字 逻辑 电路 的 功 
能 。 但 是 ， 要 想 模 拟 逻 辑 电路 的 延迟 和 功 耗 图 4.11 一 个 p- 沟 道 MOSFET 的 工作 过 程 和 NFET 





AOE TR, TE PTET MIREA NEED 类 似 ， 都 可 以 看 作 0 和 1 的 开关 。a) 当 
的 漏 极 分 别 串联 一 个 电阻 ， 在 栅 极 和 地 之 间 栅 极 为 高 电 平时 ， 无 论 源 极 和 漏 极 的 电 
增加 一 个 电容 ， 如 图 4-12 Beas? HR AE 压 如 何 ，PFET 截止 。b) 当 栅 极为 低 电 
的 电容 与 器 件 的 面积 WL. 成 正比 。 另 一 方面 ， 平 ， 源 极为 高 电 平时 ，PFET 导 通 ， 电 流 
电阻 与 器 件 的 长 宽 比 L/W 成 正比 。 电 容 和 电阻 从 源 极 流向 漏 极 





O ”物理 结构 上 ， 源 极 和 漏 极 相同 ， 它 们 的 不 同 之 处 在 于 电压 不 同 。NFET (PFET) 的 源 极 是 两 个 非 栅 极 中 电压 最 
小 (最大) 的 。 

名 ”本 书 中 把 所 有 电容 都 放 在 栅 极 上 ， 而 实际 上 ， 在 源 极 和 漏 极 也 存在 电容 ， 通 常 电容 值 大 约 等 于 栅 极 电容 的 一 
半 (电容 值 取 决 于 器 件 大 小 和 几何 形状 )。 
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等 式 如 下 : 
C,= WLK, (4-1) 
L 
R = wre (4-2) 


其 中 ，K 是 常数 ， 即 单位 面积 上 的 电容 ( 单位: 法拉) ，K 是 电阻 常数 〈 单 位: 欧姆 /平方 ) 。 
对 于 NFETS 和 PFETS 而 言 ，K。 相同 ， 但 是 K, 却 因 比率 K, 不 同 而 不 同 ，PFETS 比 NFETS 电 
阻 大 。 


g g B=! er 
=0,s=1 闭合 
d == E= 0. s= 0 未 定义 
d GE RWLKe A 
d 
R, = TEK 
d 
b) g=0 断 开 
g g = 1,s= 0 闭合 
sa T E1521 未 定义 
s e= WLKÇ 


图 4-12 一 个 PFET a) 和 一 个 NFET b) 的 电路 模型 。 栅 极 电 容 的 大 小 与 面积 (WL) 成 正比 ， 
电阻 与 栅 极 的 长 度 成 正比 ， 与 其 宽度 成 反比 


图 4-13a 指出 晶体 管 (NFET 和 PFET) 的 电流 是 输入 电压 的 函数 。 在 稳 态 数字 系统 中 ， 唱 
体 管 只 能 工作 在 曲线 的 两 端 ， 而 这 两 端 工作 电流 大 小 会 相差 好 几 个 数量 级 。 该 图 也 验证 了 开关 
模型 。 图 4-13 也 说 明了 NFET 驱动 电流 与 PFET 驱动 电流 之 比 K, 接近 2.5。 图 4-13b 说 明 随 着 
源 -漏电 压 下 降 到 0， 唱 体 管 停止 导电 (不 再 消耗 功率 ) 。 图 4-14 可 以 看 出 反 相 器 的 稳 态 输出 
电压 是 输入 电压 的 函数 。 这 个 曲线 图 也 说 明了 CMOS 电路 的 抗 扰 性 ， 不 管 输入 电压 的 高 低 ， 小 
范围 的 幅 值 变 化 还 是 噪声 都 不 会 影响 输出 电压 。 

为 了 方便 起 见 ， 这 里 讨论 的 内 容 与 具体 工艺 无 关 ， 我 们 选 定 某 工 艺 中 的 最 小 的 栅 极 长 度 
Li 为 单位 表示 WALL, PWM, 28 nm 工艺 中 ， 把 具有 元 =28 nm, W=224 nm 的 器 件 称 为 工 = 1, 
W=8 24, AA L= 1 是 默认 值 ， 也 可 以 将 其 简称 为 到 =8 F KEREM F, WAW pin 
(W. =8Lnin) 为 基准 放大 ， 并 且 把 最 小 的 W/L =8 的 器 件 作为 单位 大 小 器 件 ， 然 后 其 他 器 件 的 
大 小 都 与 单位 大 小 器 件 有 关 。 

表 4-1 列 出 了 130 nm 和 28 nm 工艺 中 KE、Kw 和 Ku 的 典型 值 。 表 中 最 关键 的 参数 是 ry 和 
Ts， 它们 是 工艺 中 最 基本 的 时 间 常 数 。 随 着 工艺 的 发 展 ，K。( 单 位 : BERL.) 与 栅 极 长 度 的 
比例 没有 太 大 变化 ， 近 似 值 为 

K. = 1.25 x 10°L,,, (4-3) 
Zu 单位 是 米 ; 栅 极 的 方块 电阻 和 延 时 不 再 与 栅 极 长 度 成 正比 ，n- 型 晶体 管 电阻 增加 ， 而 PFET 
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图 4-13 130 nm 晶体 管 特性 的 模拟 图 。 图 中 可 以 看 出 NFET (K) 和 PFET (虚线 ) 的 漏 极 
电流 分 别 是 栅 极 电压 a) 和 漏 极 电压 b) 的 函数 





0.8 


输出 电压 (=1.2) 
° 
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> 
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0 t i 
0 0.2 0.4 0.6 0.8 1 1.2 
输入 电压 (Pu=1.2) 


图 4-14 反 相 器 的 输出 电压 是 输入 电压 的 函数 
的 电阻 是 常数 。 





O 关于 晶体 管 的 发 展 预测 和 信息 ， 请 查阅 国际 半导体 技术 发 展 报告 。 
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4-1 典型 的 130 nm 和 28 nm CMOS 工艺 器 件 参数 。 假 设 栅 极 长 度 最 小 ， 栅 极 宽度 可 变 ， 





得 到 下 列 数据 
# 数 值 (130nm) 值 (28nm) 单 位 # 数 (8 (130nm) 值 (28nm) 单 位 
Ke 2.0x10-6 2.8x107' PhD, Krp =KpKyy 5 x<104 5.5 x 104 欧姆 /平方 
Kin 2 x 104 4.2 x 10* 欧姆 /平方 | ty =KeKan ”3.9x10- 12xl0-2 秒 
Kp 2.5 1.3 Tp =KcKpp 9.8xl0-2 1.5xl0-2 # 





例 4-2 电阻 和 电容 

对 于 130 nm 和 28 nm LË, 当 L=1 jf HE W =32 时 ，NFET 的 电阻 (R,) 和 栅 极 电容 (C) 
是 多 少 ? 一 个 具有 相同 R. 的 PFET 的 大 小 和 电容 是 多 少 ? 

W A, # NFET 的 电阻 和 栅 极 电容 : 





E Los 
R. = wes = 327 . 及 RN 
R, i = 625 Q 
R. >| = 1313 -Q 
C, = WLK. 
Caio = 6.4 fF 
CAPM = 0. 896 fF 
接 下 来 ， 已 知 电阻 ， 求 PFET 的 宽度 和 电容 : 
LK 
W, = R. 
LK, K 
m, = Fake 
W, = KF, 
W130 = 80L,,, 
W,, = 41. 6L ain 
C130 = 16 fF 
C, 28 = 1.16 fF 


4.3 CMOS 门 电路 


在 4.1 节 中 ,我们 学 习 了 如 何 使 用 开关 实现 逻辑 功能 ， 学 习 4.2 节 后 ， 知 道 了 对 于 大 多 数 
数字 电路 ， 可 以 使 用 开关 模拟 MOS 晶体 管 。 把 这 些 所 学 内 容 综合 起 来 ， 就 能 知道 如 何 使 用 晶 
体 管 实现 逻辑 电路 了 。 

一 个 结构 良好 的 逻辑 电路 ， 其 输出 端 应 该 能 够 与 另 一 个 类 似 逻 辑 电 路 的 输入 端 相连 ， 这 样 
才 有 利于 进行 数字 抽象 。 因 此 ， 我 们 需要 该 逻辑 电路 的 输出 端 能 产生 一 定 的 电压 ， 而 不 仅仅 是 
简单 地 将 两 个 终端 相连 。 此 外 ， 还 要 求 电路 具备 可 恢复 能 力 ， 这 样 当 输入 电 平 降低 时 输出 电 平 
不 受 影响 。 为 了 达到 这 个 目的 ， 输 出 端 电压 应 来 自 电源 电压 而 非 输入 端 。 


4.3.1 基本 的 CMOS 门 电 路 


一 个 静态 CMOS 门 电路 实现 一 个 逻辑 函数 了 的 同时 也 产生 了 一 个 与 输入 相 一 致 的 恢复 输 
出 ， 如 图 4-15 所 示 。 当 函数 /为 真 时 ，PFET 开关 网 络 把 输出 端 * 和 电源 正极 (Vo) 相连 ; 4 
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函数 /为 假 时 ，NFET 开关 网 络 把 输出 x 与 电源 负极 相连 。 这 样 ， 就 符合 了 只 有 逻辑 1 (高 电 
P) 信号 通过 PFET FRIES, HO REF) 
信号 通过 NFET 网 络 的 要 求 。 由 PFET 网 络 和 
NFET 网 络 实现 了 函数 互补 。 如 果 函 数 重 又 (同时 ， 
为 真 ) ,将 造成 电源 和 地 之 间 短 路 ,产生 大 量 电 
流 ， 还 可 能 引起 电路 的 永久 损坏 。 如 果 这 两 个 函 
数 没有 覆盖 所 有 的 输入 状态 (对 于 有 些 输入 状态 ， 
两 个 函数 值 都 不 为 真 ) ， 那 么 在 这 些 输入 状态 下 ， 
输出 为 未 定义 。 

因为 在 输入 为 高 电 平时 ，NFET 打开 ， 输 出 为 
低 电 平 ，PFET 则 相反 ， 所 以 静态 CMOS 门 电路 只 ae 
能 产生 反 相 逻辑 函数 。 在 一 个 CMOS 门 电路 中 ， 四 ZA CMOS EREA- A PRET JF 
输入 端的 正 ( 负 ) 跳 变 要 么 会 引起 输出 端的 负 

I sa 数 /为 真 时 ，PFET 开关 网 络 把 输出 
CE) 跳 变 ， 要 么 不 会 引起 输出 端的 变化 。 输 入 端 pt See. SPE 
一 个 方向 上 的 跳 变 引起 输出 端 具 在 一 个 方向 上 的 TAURUA Rr GFR 
跳 变 ， 称 为 单调 (monotonic) 逻辑 图 数 。 如 果 输 
出 端的 跳 变 与 输入 端的 跳 变 方向 相反 ， 那 么 就 称 此 函数 是 单调 递减 或 者 反 相 逻辑 函数 。 如 果 是 [6] 
同一 方向 的 跳 变 ， 那 么 就 称 为 单调 递增 函数 。 为 了 实现 一 个 非 反 相 或 非 单调 逻辑 函数 需要 多 级 
CMOS 门 。 

使 用 公式 (3-9) 所 示 的 对 偶 原则 ， 可 以 化 简 门 电路 的 设计 。 如 果 有 一 个 NFET 下 拉 网 络 
可 以 实现 函数 广 (5 50° 5) ， 由 对 偶 性 可 知 万 = 大 ( a.) SA Crs), MART AKA 
KAS, =f (XXn) o AIF PFET 上 拉 网 络 ， 我 们 希望 得 到 具有 反 相 输入 的 对 偶 函 数 。 因 为 当 
输入 为 低 电 平时 ，PFET“ 导 通 ”， 所 以 PFET 提供 了 反 相 输入 。 为 了 得 到 对 偶 函 数 ， 我 们 把 下 
拉 网 络 中 的 与 门 用 或 门 代 替 ， 或 门 用 与 门 代 替 。 在 开关 网 络 中 ， 这 意味 着 在 下 拉 网 络 中 的 串联 
连接 会 变 成 上 拉 网 络 中 的 一 个 并 联 连接 ， 反 之 亦 然 。 


4.3.2 反 相 器 、 与 非 门 、 或 非 门 


最 简单 的 CMOS 门 电路 就 是 反 相 器 ， 如 图 4-16a 所 示 。 当 输入 a 的 值 为 低 电 平时 ，x = a。 
此 时 PFET 网 络 是 一 个 连接 输出 x 和 电源 正极 的 晶体 管 。 类 似 地 ， 当 输入 的 值 为 高 电 平时 ， 
NFET 网 络 是 一 个 把 输出 x 拉 为 低 电 平 的 晶体 管 。 

图 4-16b 是 反 相 器 的 逻辑 符号 。 它 是 一 个 在 输入 或 输出 端 有 个 圆圈 的 向 右 的 三 角形 。 三 角 
形 代 表 一 个 放大 器 一 一 表明 对 信号 进行 恢复 。 圆 圈 
《有 时 称 为 反 相 圈 ) 代表 求 反 。 输 入 端的 圆圈 是 信号 T —>o— 





在 输入 到 放大 器 之 前 进行 求 反 操 作 。 类 似 地 ， 输 出 
端的 圆圈 是 信号 被 放大 后 进行 求 反 操作 。 逻 辑 上 ， 
两 种 符号 等 价 。 不 管 在 放大 前 还 是 放大 后 对 信和 号 求 





反 都 没有 关系 ， 可 以 选择 两 种 符号 的 一 种 ， 但 要 符 a) b) 

合 下 面 的 圆圈 规则 。 图 4-16 CMOS 反 相 器 电路 。a) 当 a=0 时 ， 
圆圈 规则 : 尽量 使 输出 端 带 有 反 相 圈 的 门 的 输 PFET 把 x 和 1 连接 在 一 起 ， 当 a= 

出 信号 是 输入 端 带 反 相 圈 的 门 的 输入 。 1 时 ，NFET 把 x 和 0 连接 在 一 起 。 
使 用 上 述 规则 绘制 的 原理 图 ， 其 可 读 性 要 强 于 b) 反 相 器 的 逻辑 符号 。 输 入 端 或 


那些 线路 两 端 出 现 极 性 翻转 的 原理 图 。 这 样 的 例子 输出 端的 圆圈 表示 求 反 操 作 
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在 第 6 章 中 有 很 多 。 

图 4-17 是 一 些 NFET Ail PFET 开关 网 络 的 实例 ，NFET 和 PFET 开关 网 络 可 以 用 来 构建 与 非 
门 和 或 非 门 电路 。 如 果 任 意 一 个 输入 为 低 电 平 ， 并 联 的 PFET (图 4-17b) 把 输出 上 拉 为 高 电 
平 , /=5V5=aA5。 使 用 对 偶 原则 ， 这 个 开关 网 络 和 串联 的 NFET 网 络 (图 4-17c) 组 合 实现 
一 个 与 非 门 。 完 整 的 与 非 门 电路 如 图 4- 18a 所 示 ， 两 个 与 非 门 的 原理 图 符号 如 图 4-18b 所 示 ， 
上 面 的 符号 是 一 个 在 输出 端 带 反 相 图 的 与 门 符号 (左边 方形 ， 右 边 半圆 形 ) ,含义 是 输入 a 和 
b 相 与 后 求 反 , /=a 人 5。 下 面 的 符号 是 一 个 在 所 有 输入 端 都 带 反 相 圈 的 或 符号 (左面 是 弯曲 
的 ， 右面 是 尖 央 的 ) ， 所 有 输入 反 相 后 进行 或 运算 , /=aV5。 由 德 . 摩根 律 〈 以 及 对 偶 性 ) 可 
知 ， 这 两 个 函数 等 价 。 与 反 相 器 一 样 ， 我 们 可 以 在 这 两 个 符号 之 间 选 择 一 个 来 验证 圆圈 规则 。 


a 

a4 < al oe a r 

T Du ha ee 
a) b) c) d) 


图 4-17 实现 与 非 门 和 或 非 门 的 开关 网 络 。a) 当 所 有 输入 都 为 低 电 平时 ， 串 联 的 PFET 把 输 
出 c 上 拉 为 高 电 平 , f=a Ab=aVb, b) 当 任 意 一 个 输入 为 低 电 平时 ， 并 联 的 PFET 
把 输出 上 拉 为 高 电 平 , f=a&V5=a 人 b。c) 当 输入 都 为 高 电 平时 ， 串 联 的 NFET 把 输 
出 下 拉 为 低 电 平 , f=a 人 5。d) 当 任意 一 个 输入 为 真 时 ， 并 联 的 NFET 把 输出 下 拉 为 
低 电 平 , f=aVb。 与 非 门 由 网 络 b) Alc) 构成 , 或 非 门 由 网 络 a) Md) 构成 







x=(anb)=avb 


a) b) 
图 4-18 CMOS 与 非 门 。a) 电路 图 : 与 非 门 是 由 一 个 并 联 的 PFET 上 拉 网 络 和 一 个 串联 的 
NFET 下 拉 网 络 构成 。b) 逻辑 符号 ; 可 以 把 与 非 函 数 看 作 具有 反 相 输 出 (顶部 ) 的 
与 运算 ,也 可 以 看 作 具 有 反 相 输入 (底部 ) 的 或 运算 
可 以 用 一 个 PFET 的 串联 网 络 和 一 个 NFET 的 并 联网 络 构建 一 个 或 非 门 ， 如 图 4-19a 所 示 。 
4 a 和 5b 的 值 都 为 低 电 平 时 ，PFET 的 串联 网 络 (图 4-17a) 把 输出 与 1 相连 接 , f=a Ab = 
aVb。 使 用 对 偶 性 ， 这 个 电路 用 于 和 并 联 的 NFET 下 拉 网 络 (图 4-17d) 组 合 。 或 非 的 逻辑 符 
号 如 图 4-19b 所 示 。 与 反 相 器 和 与 非 门 一 样 ， 我 们 可 以 根据 圆圈 规则 在 反 相 输入 和 反 相 输出 之 
间 进 行 选择 。 
例 4-3 4 输入 与 非 门 
画 出 4 输入 与 非 门 的 晶体 管 级 实现 , /=aADAcAd。 
实现 这 个 门 可 以 对 2 输入 与 非 门 进行 扩展 ， 方 法 是 ;串联 两 个 NEFET， 并 联 两 个 PFET。 最 
终 的 与 非 门 晶体 管 级 实现 如 图 4-20 所 示 。 
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x=(avb)=anb 


a) b) 
el 4-19 CMOS 或 非 门 。a) 电路 图 : 或 非 门 由 一 个 串联 的 PFET 上 拉 网 络 和 一 个 并 联 的 NFET 
下 拉 网 络 构成 。b) 逻辑 符号 : 或 非 符号 可 以 看 作 一 个 带 有 反 相 输出 的 或 门 ， 或 者 是 
一 个 带 有 反 相 输入 的 与 门 


4.3.3 复杂 门 


构建 门 电路 不 能 局 限于 使 用 串联 和 并 联网 络 ， 还 可 以 
使 用 任意 串 - 并 联网 络 ， 甚 至 可 以 使 用 非 串 - 并 联网 络 。 
例如 ,图 4-21a 是 一 个 与 -或 - 非 (AOL) 门 的 晶体 管 级 设 
计 。 这 个 电路 实现 函数 /= TEAD Vc。 下 拉 网 络 中 ga 和。 = 
串联 再 和 < 并联 。 上 拉 网 络 是 下 拉 网 络 的 对 侦 式 ，a 和 6 并 
联 再 和 < 串联 。AOI 的 逻辑 符号 如 图 4-21b 所 示 。 

图 4-22 是 一 个 择 多 函数 的 反 相 门 。 因 为 择 多 函数 是 一 < 
个 单调 递增 函数 而 且 门 电路 只 能 实现 反 相 函数 ， 所 以 我 们 d 
无 法 构建 单 级 择 多 函数 门 ， 但 是 我 们 可 以 构建 择 多 函数 的 
补 ， 如 图 所 示 。 择 多 函数 是 它 自己 的 对 偶 函 数 。 也 就 是 说 ， 图 4 .20 4 输入 与 非 门 的 蝇 体 管 
maj(a,b,¢) =maj(a,b,e) 。 正 因为 这 样 ， 我 们 就 能 使 用 上 拉 级 实现 
网 络 与 下 拉 网 络 相同 的 网 络 实现 择 多 函数 门 ， 如 图 4-22a 所 示 。 因 为 择 多 函数 中 所 有 输入 都 等 
价 ， 所 以 它 是 一 个 对 称 逻辑 函数 ， 交 换 PFET 和 NFET 网 络 的 输入 不 会 改变 函数 。 





° 









x=(axb)yvce=(avb)xc 


a) b) 
图 4-21 与 -或 - 非 (AOI) Jo a) AOI 门 的 晶体 管 级 实现 : 使 用 一 个 并 - 串联 的 NFET F 
拉 网 络 和 与 它 对 偶 的 串 - 并 联 的 PFET 上 拉 网 络 构成 。b) AOI 门 的 两 种 逻辑 符号 
更 常见 的 择 多 - 反 相 门 的 实现 方法 如 图 4-22b 所 示 。 这 里 的 NFET 下 拉 网 络 和 图 4-22a 中 
的 NFET 下 拉 网 络 一 样 ， 但 是 PFET 上 拉 网 络 由 下 拉 网 络 的 对 偶 网 络 人 代替， 对偶 网 络 是 用 并 联 
代替 串联 ， 反 之 亦 然 。 例 如 ， 在 下 拉 网 络 中 ,5 和 并联 后 再 和 au 串联 ， 那 么 在 上 拉 网 络 中 ， 
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把 5 和 c WIFREN EB IR Jia BG JK. PFET 上 拉 网 络 是 NFET 下 拉 网 络 的 对 偶 网 络 ， 由 
公式 (3-9) 得 知 ，PFET 上 拉 网 络 总 是 下 拉 网 络 补 的 开关 函数 。 

图 4-22c 是 择 多 - 反 相 门 的 两 种 逻辑 符号 。 因 为 择 多 函数 具有 上 自 对 偶 性 质 ， 所 以 把 反 相 图 
放 在 输入 和 输出 都 没关系 ,都 是 择 多 函数 。 当 三 个 输入 中 至 少 有 两 个 输入 为 高 电 平 时 ,输出 为 
低 电 平一 一 用 低 电 平 表示 输出 为 真 的 择 多 函数 ; 当 三 个 输入 中 至 少 有 两 个 输入 为 低 电 平时 ， 输 
出 为 高 电 平一 一 用 低 电 平 表 示 输 入 为 真 的 择 多 函数 。 


a 


a, š 
a ° 
: drs š 


b) c) 
图 4-22 一 个 择 多 函数 的 反 相 门 。 当 2 个 或 3 个 输入 为 真 时 ， 输 出 为 假 。a) 使 用 对 称 的 上 
拉 和 下 拉 网 络 实现 。b) 使 用 上 拉 网 络 实现 ， 这 个 上 拉 网 络 是 下 拉 网 络 的 对 偶 式 。 
e) 逻辑 符号 : 无 论 是 在 输入 还 是 输出 位 置 求 反 ， 这 个 函数 都 是 择 多 函数 
严格 来 讲 ， 因 为 XOR 不 是 单调 函数 ， 所 以 我 们 不 能 构建 单 级 CMOS 异 或 (XOR) 门 。 输 
入 的 正 向 变化 可 以 引起 输出 正 向 或 者 负 向 变化 ， 还 要 取决 于 其 他 输入 的 状态 。 但 是 ， 如 果 能 得 
到 反 相 输入 ， 就 能 实现 2 输入 XOR 函数 ， 如 图 4-23a MR, CRA R 4-7a 所 示 的 开关 网 络 的 
优点 ，3 输入 XOR 函数 实现 如 图 4-23b 所 示 ， 这 里 的 开关 网 络 不 是 串 - 并 联网 络 ; 如 果 不 能 得 
到 反 相 输入 ， 使 用 两 个 串联 的 CMOS 门 实现 一 个 2 输入 XOR 门 更 有 效 ， 如 图 4-23e 所 示 。 我 们 
把 这 个 电路 的 晶体 管 级 设计 作为 一 个 习题 。XOR 符号 如 图 4-23d 所 示 。 
例 4-4 CMOS 门 综合 
画 出 一 个 复杂 门 电路 ， 其 功能 为 : 当 且 仅 当 输入 cba 是 一 个 合法 的 温度 - 编码 信号 时 ， 输 
出 为 0。 
首先 ， 写 出 布尔 函数 ， 化 简 如 下 : 
f(e,b,a)= (ë Ab Aa) V(eAbAa) V(eAbAa) V(cAbAa) 
= (¢Ab) V (b Aa) 
这 样 ，NFET 开关 网 络 函 数 为 








f, = (e Ab) V (b Aa) 
接着 ， 为 了 正确 地 画 出 PFET 阵列 ， 写 出 NFET 函数 的 对 偶 函 数 如 下 : 
f,(c,b,a) = (€ V b) A (b V a) 
图 4-24 是 最 终 的 答案 。 为 了 用 单 级 实现 这 个 电路 ， 需 要 输入 c fb Hah, 


4.3.4 三 态 电路 


有 时 我 们 希望 构建 一 个 分 布 式 多 路 选择 器 函数 。 当 逻辑 信和 号 a 为 真 时 ， 从 点 4 驱动 一 个 值 到 信 
号 节点 ; 当 逻 辑 信号 2 为 真 时 ， 从 点 B 驱动 一 个 值 到 信号 节点 。 实 现 这 个 功能 可 以 使 用 三 态 (tri- 
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a) b) c) d) 
图 4-23 异 或 (XOR) 门 。a) 2 输入 异 或 门 的 晶体 管 级 电路 图 。b) 3 输入 异 或 门 的 晶体 管 
级 电路 图 。c) 计算 两 数 异 或 的 两 级 逻辑 原理 图 。d) 异 或 门 的 逻辑 符号 
state) 反 相 器 。 这 个 电路 如 图 4-2$a 和 图 4-25b 所 示 。 当 。 WH 
HJ, Roa Bx, Ye 为 假 时 ， 输 出 高 阻 态 (不 是 1 也 不 是 0) 。 
当 使 能 输入 e 为 高 电 平 (e 为 低 电 平 ) 时 ， 中 间 的 晶体 管 打开 。 
由 a 控制 的 最 外 面 的 晶体 管 作用 和 普通 反 相 器 一 样 。 当 。 为 低 电 
平时 〈z 为 高 电 平 ) ， 晶 体 管 断 开 ， 没 有 值 被 驱动 输出 。 在 这 种 
状态 下 ， 输 出 值 最 初等 于 上 一 个 输出 值 ， 但 是 最 终 变 成 一 个 未 
知 状态 。Verilog 中 ， 如 果 某 根 线 没有 连接 任何 驱动 ， 可 以 用 符 2 
= z 表示 。 
三 态 反 相 器 不 是 4.3.1 节 中 定义 的 门 ， 因 为 它 的 输出 不 是 
输入 的 可 恢复 远 辑 函数 。 它 的 下 拉 函 数 /.(a,e) =a Ae 不 等 于 其 


EMRS, =ā Ne 的 补 。 = i Alls, 都 为 假 时 ， 函数 大 = 凡人 /= 图 4-24 CMOS 电路 原理 图 ， 其 


为 真 ， 此 时 x 为 高 阻 态 或 z 态 。 因 为 这 个 电路 有 三 种 输出 状态 ， 功能 是 检测 输入 cba 
0、1 和 z， 所 以 称 它 为 三 态 电 路 。 不 要 与 三 值 逻 辑 电 路 混淆 ， 三 是 否 是 合法 的 温度 
值 逻 辑 电 路 中 使 用 的 是 具有 三 个 值 的 信和 号。 编码 


三 态 电路 的 使 用 范围 不 局 限于 反 相 器 。 我 们 可 以 在 任意 一 
个 CMOS 门 电路 加 上 使 能 信号 ， 当 使 能 信号 e 为 低 电 平时 ， 断 开 输 出 ， 我 们 不 局 限于 使 用 一 个 
使 能 信号 ,任意 逻辑 函数 也 能 决定 何 时 使 能 电路 ， 这 个 函数 会 因为 上 拉 和 下 拉 而 有 所 不 同 ， 使 
能 函数 可 以 是 其 他 电路 输入 的 函数 。 上 拓 关 0 的 任意 CMOS 电路 都 是 一 个 三 态 电路 ,但 不 是 所 有 
这 样 的 电路 都 有 用 。 

三 态 反 相 器 可 以 用 来 实现 多 路 选择 器 和 分 布 式 多 路 选择 器 ， 如 图 4-25c 所 示 。4 个 三 态 反 
相 器 都 驱动 相同 的 输出 ，wire 型 变量 x。 如 果 只 有 一 个 使 能 信号 e 有 效 ， 那 么 x =a;。 如 果 所 有 
的 使 能 信号 为 低 电 平 ， 则 没有 输入 值 驱动 到 x 一 一 x 处 于 高 阻 态 或 z 态 。 如 果 同 一 时 间 (甚至 
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非常 短 的 时 间 ) 不 止 一 个 使 能 信号 有 效 时 ， 就 会 造成 短路 ， 引 起 静态 电流 从 一 个 门 的 电源 到 另 
一 个 门 的 地 ， 这 样 至 少 会 造成 功 耗 增加 并 给 出 一 
个 无 效 输出 。 在 最 坏 的 情况 下 ， 引 起 的 大 电流 能 
够 气 化 电感 金属 ， 造 成 不 可 道 的 对 芯片 的 损坏 。 ¿Do 


即使 每 个 时 钟 周期 只 有 一 个 使 能 信号 有 效 ， 时 钟 a) 

偏 斜 〈 详 见 第 15 BE) 也 会 导致 不 同 的 使 能 有 效 

EA, MA AMBEERR, SH E 4 

大 的 时 钟 偏 移 ， 所 以 经 常 使 用 三 态 电路 的 分 布 式 “|e p 


多 路 选择 器 也 特别 容易 损坏 。 

为 了 不 造成 短路 ， 请 慎重 使 用 三 态 电路 。 如 果 
使 用 它们 ， 就 应 该 采取 措施 确保 使 能 信号 间 不 出 现 
重 春 。 一 种 方法 是 在 一 个 使 能 信号 有 效 和 另 一 个 使 
能 信号 有 效 之 间 加 入 空 六 周期 一 一 此 时 ， 所 有 使 能 SAS D am P. ee eae a 
信号 为 低 电 平 。 另 外 一 种 方法 是 在 设计 驱动 使 能 信 ee eee 
SHER a SOR INT Td Td BR, EEIE tgp ado ; 

: & 到 输出 上 ; `4 e 为 高 电 平时 ， 输 出 为 
一 个 长 时 延 ， 在 下 降 沿 有 一 个 短 时 延 一 一 用 足够 a. c) 4 个 三 态 反 相 器 实现 了 一 个 总 
长 的 时 延 弥 补 时 钟 偏 斜 和 其 他 因素 。 在 大 多 数 情 线 或 者 分 布 式 多 路 选择 器 。 当 只 有 一 
况 下 ， 最 好 的 方法 是 用 静态 CMOS 门 (与 非 门 和 个 使 能 输入 e 为 高 电 平 时 ,输出 是 
或 非 门 ) 构建 所 需 函 数 一 一 其 至 可 以 是 分 布 式 多 a; 当 所 有 的 使 能 为 低 电 平时 ,输出 
PASE (HAIT). 为 高 阻 态 ; 如 果 多 个 使 能 为 高 电 平 ， 


4.3.5 应 避免 使 用 的 电路 那么 就 会 对 晶体 管 造成 永久 损害 


本 章 结束 前 ， 有 必要 看 看 那些 不 是 静态 门 电路 ， 也 无 法 正常 工作 的 电路 ， 它 们 代表 着 
CMOS 电路 设计 中 的 常见 错误 。 图 4-26 是 4 种 具有 代表 性 的 错误 。 图 4-26a 中 的 电路 试图 通过 
NFET 传递 1， 通 过 PFET 传递 0 ( 原 书 有 误 一 一 译 者 注 ) ， 所 谓 的 缓冲 不 起 任何 作用 。 晶 体 管 
不 能 可 靠 地 传输 这 些 值 ， 所 以 输出 信号 为 未 定义 ， 充 其 量 就 是 输入 摆 幅 的 衰减 。 图 4-26b 所 示 
的 与 - 非 电 路 实际 上 实现 了 逻辑 函数 = 人 A2， 但 是 因为 它 没有 恢复 输出 ， 所 以 违反 了 数字 抽 
Ro WR =O, HA a 上 的 噪声 直接 到 达 输出 端 。” 输出 端的 任何 噪声 也 会 影响 输入 信号 和 驱 
动 门 的 所 有 输入 。 

图 4-26c 所 示 电 路 中 ， 当 a=1 并且 =0 时 ， 和 输出 端 断 开 。 因 为 有 寄生 电容 的 存在 ， 所 
以 前 一 个 输出 值 会 短 时 间 存 储 在 输出 节点 。 图 4-26d 的 最 终 电路 中 ， 当 a 和 好 不 相等 时 ， 它 的 
上 拉 和 下 拉 网 络 都 会 导 通 。 从 电源 到 地 有 静态 电流 流 过 ， 输 出 的 逻辑 值 为 未 定义 ， 这 样 ， 既 增 
加 了 功 耗 ， 又 存在 对 芯片 损坏 的 风险 。 


小 结 


CMOS 门 电路 是 现代 数字 系统 的 基础 单元 。 使 用 互补 型 MOS (CMOS) 晶体 管 可 以 由 开关 
逻辑 得 到 门 电 路 。 

当 连 接 两 端的 开关 闭合 时 ， 两 端 导 通 ; 如 果 电 路 中 有 多 个 开关 串联 连接 ， 那 么 只 有 当 所 有 
开关 都 闭合 时 ， 两 端 才 导 通 ， 这 就 是 一 个 “与 ”函数 。 类 似 地 ， 并 联 开关 实现 了 “或 ”函数 。 





b) 


O 这 样 的 电路 可 以 用 在 绝缘 区 域 ， 但 是 必须 遵循 在 长 导线 或 另 一 个 非 恢复 门 之 前 有 一 个 恢复 期 。 大 多 数 情况 下 ， 
最 好 不 使 用 这 样 的 快捷 门 。 
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这 些 电 路 不 是 静态 门 电路 ， 不 应 该 使 用 这 些 电 路 





图 4-26 三 种 不 是 门 电路 也 不 该 使 用 的 电路 : 电路 a) 通过 NFET 传递 1， 通 过 PFET 传递 0， 
电路 b) 无 法 恢复 高 输出 ， 电 路 c) 当 a=1 并且 5=0 时 ,不 驱动 输出 ， 电 路 d) 当 
a 天 时， 产生 静态 电流 
开关 的 串 -并 联网 络 能 够 实现 任意 “与 ”和 “或 ”的 组 合 函 数 。 

在 约束 条 件 下 ，NMOS 和 PMOS (n- 型 和 p- 型 MOS) 晶体 管 可 以 作为 开关 。 当 栅 极 为 高 电 
(2441) H], NMOS 晶体 管 或 者 NFET 导 通 (开关 闭合 ) ， 只 有 低 电 平 信号 (292380) Ñ 
过 。PMOS 晶体管 或 者 PFET 与 NMOS 晶体 管 互补 ， 当 机 极为 低 电 平 时 ，PMOS 晶体 管 或 PFET 
导 通 ， 此 时 只 有 高 电 平 信号 通过 。 

我 们 构建 了 一 个 实现 函数 1 的 CMOS 门 级 电路 ， 当 /为 真 时 ， 由 NFET 构建 的 下 拉 网 络 把 
输出 下 拉 为 低 电 平 ;， 当 /为 真 时 ， 由 PFET 构建 的 上 拉 网 络 把 输出 上 拉 为 高 电 平 。 因 为 PFET 的 
输入 都 是 反 相 的 ， 所 以 使 用 上 拉 网 络 得 到 所 需 函 数 ， 上 拉 网 络 是 下 拉 网 络 的 对 偶 式 。 例 如 ， 实 
现 与 非 门 ， 使 用 串联 的 NFET 作为 下 拉 网 络 ， 使 用 并 联 的 PFET 作为 上 拉 网 络 。 除 了 与 非 门 
(串联 的 NFET， 并 联 的 PFET) 和 或 非 门 (并联 的 NFET， 串 联 的 PFET) ， 还 可 以 构建 复杂 门 
电路 ， 如 与 -或 - 非 门 ， 它 可 以 实现 “与 ”和 “或 ”的 任意 组 合 ， 最 后 求 反 。 

基于 NFET 和 PFET 的 性 质 ， 所 有 CMOS 门 都 是 单调 递减 的 ， 即 递增 的 输入 永远 不 会 产生 
递增 的 输出 。 要 构建 递增 函数 需要 多 级 CMOS 门 。 

为 了 使 逻辑 电路 原理 图 可 读 性 更 强 ， 我们 使 用 圆 图 规则。 在 尽 可 能 的 情况 下 ， 如 果 导 线 的 
某 一 端 画 有 一 个 圆圈 ， 那 么 与 该 导线 另 一 端 相 连 的 门 上 也 应 该 画 一 个 圆圈 。 

三 态 门 电路 可 以 输出 高 阻 态 或 未 连接 状态 ， 有 了 这 种 输出 状态 就 允许 几 个 三 态 门 驱动 同一 
个 信号 节点 。 因 为 在 驱动 同一 个 节点 的 三 态 门 电路 之 间 可 能 出 现 短路 ， 所 以 尽 可 能 不 使 用 这 样 
的 电路 。 


文献 说 明 


最 早 关 于 使 用 开关 网 络 的 研究 来 自 Shannon [97] 和 Montgomerie [79 ] 。 最 早 使 用 开关 模型 
模拟 MOSFET 电路 之 一 的 是 在 20 世纪 80 年 代 初 的 Bryant [21 ] 。 

数字 电路 设计 文章 ， 如 Rabaey 等 [91] 提供 了 关于 数字 逻辑 电路 的 详细 介绍 。 

Weste 和 Harris 编写 的 教材 [108] 提供 了 关于 门 布局 和 VLSI 的 更 多 信息 。 

最 后 ， 对 MOSFET 的 物理 特性 感 兴趣 的 读者 可 以 参考 Muller, Kamins 和 Chan 的 文章 
[82]. 


习题 

4.1 非 - 串 联 - 并 联 分 析 ， 工 。 图 4-27a 是 连接 两 个 终端 的 开关 网 络 ， 写 出 描述 它 的 逻辑 函数 。 注 意 它 
不 是 串联 - 并 联网 络 。 

4.2 44-$R-H#HROM, H. A4-27b 是 连接 两 个 终端 的 开关 网 络 ， 写 出 描述 它 的 逻辑 函数 。 

4.3 串联 -并 联 综合 ，[。 画 出 一 个 串联 - 并联 开关 电路 ,使 其 实现 如 下 函数 : f(x,y,z) =((zVy)A 
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4.4 


4.5 


4.6 


Fagy AAEH 


((y Az) Vž))V(xAyAz)o 
串联 -并 联 综合 ， 开 。 画 出 一 个 串联 - 并 联 开关 电路 ， 使 其 实现 如 下 函数 : 如 果 有 至 少 一 个 输入 为 
R, AAS (w, x, y, z) =l, ae a 
串联 -并联 综合 ， 耳 。 夯 出 一 个 串联 - 并 联 开关 电 T “hs 
路 ， 使 其 实现 如 下 函数 : 如 果 有 至 少 两 个 输入 为 真 ， 了 à 

foe gA g lig: 
MBAS (w, x, y, z) =1, ð i 
SR-HRES, N. Imh — 4 E - 并 联 开 关 电 
路 ， 使 其 实现 如 下 函数 : 如 果 有 至 少 三 个 输入 为 真 ， 图 4-27 习题 4 1 和 习题 4 2 的 开关 网 络 
IAF (w, x, y, z) 三 1 
串联 -并 联 综合 ，V 。 画 出 一 个 串联 -并 联 开关 电路 ， 使 其 实现 如 下 函数 : 如 果 四 个 输入 都 为 真 ， 
那么 f Gu, x, y, z) =le 
串联 一 并 联 综合 ，W[。 画 出 一 个 串联 -并 联 开关 电路 ， 使 其 实现 如 下 函数 ; 如 果 有 一 个 或 三 个 输入 
AK, BAS (o, z, y, z) =l, 
# J — 33652, VI, mWih— 4 BE -并 联 开关 电路 ,使 其 实现 如 下 函数 : 如 果 输 入 xyz 代表 1 或 
者 是 二 进 制 素数 (xyz =001, 010, O11, 101, 111), 那么 f(x,y,z) =1。 
串联 -并 联 综合 ， 佣 。 画 出 一 个 串联 -并 联 开关 电路 ， 使 其 实现 如 下 函数 : 如 果 输 入 wxyz 代表 1 
或 者 是 二 进 制 素数 (zxyz =0001,0010 ,0011 ,0101 0111 ,1011,1101), ABA f(w,x,y,z) =1。 
CMOS 开关 模型 ， 工 。 输 入 为 wa=1, b=0, c=0, MHK] 4-22a 的 开关 模型 (使 用 断 开 和 闭合 的 开 


关 代 替 晶 体 管 ) 。 

CMOS 开关 模型 ， 工 。 输 入 为 a=1, 5=1，c=1， 画 出 图 4-22a 的 开关 模型 (使 用 断 开 和 闭合 的 开 
KRE EE ) 。 

CMOS 开关 模型 ， 亚 。 根 据 图 4-23a 的 电路 图 ， 输入 为 a=1, b=0, MARR (使 用 断 开 和 
闭合 的 开关 代替 晶体 管 ) 。 


CMOS 开关 模型 ，KV 。 根 据 图 4-23b 的 电路 图 ,输入 为 wu=1, =0，c=1， 画 出 开关 模型 (使 用 断 
开 和 闭合 的 开关 代替 晶体 管 ) 。 
电阻 和 电容 ， 工 。 针 对 130 nm 和 28 nm LË, BRIA WIRE L= Luns IEE W = 20L nin H NFET 
的 电阻 和 栅 极 电容 。 如 果 PFET 的 电阻 是 NFET 的 电阻 的 一 半 ，NFET 中 W=20L,,,, 362A PFET 的 
宽度 和 栅 极 电容 是 多 少 ? 
电阻 和 电容 ， 工 。 针 对 130 nm 和 28 nm CTE, BEIA KRKE L= Lans 计算 W=40L,,, 19 PFET 
的 电阻 和 栅 极 电容 。 如 果 NFET 的 电阻 是 PFET 的 电阻 的 两 倍 ，PFET 中 W=40L,,,, ABA NFET 的 
宽度 和 栅 极 电容 是 多 少 ? 
计算 吞吐 量 。 设 计 一 个 逻辑 模块 ， 面 积 为 1 x 10" Ps。 每 400(1 + Ar )T, 秒 完成 一 个 工作 单位 。 所 
有 尺度 参数 参考 表 4-1。 
(a) 使 用 130 nm 和 28 nm 工艺 时 ， 能 在 1 mm? 芯片 上 分 别 放 置 多 少 模块 ? 
(b) 使 用 130 nm 和 28 nm 工艺 ,一 个 模块 完成 一 个 工作 单元 (延迟 ) 需要 多 长 时 间 ? 

(c) 使 用 130 nm 和 28 nm 工艺 , 一 个 芯片 一 秒 钟 总 共 能 完成 多 少 工作 量 (吞吐 量 )? 
简单 门 电路 ， 工 。 画 出 3 输入 与 非 门 的 晶体 管 实现 。 
简单 门 电路 ， 卫 。 画 出 4 输入 或 非 门 的 晶体 管 实现 。 
CMOS 电路 原理 图 ，I。 使 用 NFET 和 PFET 画 出 可 恢复 逻辑 门 电路 原理 图 ， 实 现 函 数 f=aA(DVc)。 
CMOS +% R24, H. (HAY NFET 和 PFET 画 出 可 恢复 逻辑 门 电 路 原理 图 ， 实 现 函 数 卫 = 
((aAb)Ve)V(dAe). 
CMOS 电路 原理 图 ， 亚 。 假 设 已 知 所 有 输入 和 它们 的 补 ， 使 用 NFET 和 PFET 画 出 可 恢复 逻辑 门 电 
路 原理 图 ， 实 现 函 数 /=(aAbAe)V(aAbAce)。 
CMOS 电路 原理 图 ，IV 。 假 设 已 知 所 有 输入 和 它们 的 补 ， 使 用 NFET 和 PFET 画 出 可 恢复 逻辑 门 电 
路 原理 图 ， 实 现 当 且 仅 当 cba =010, 011, 101, 111 Bf, PAR f=0, 


4.31 
4. 32 
4. 33 
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CMOS 电路 原理 图 ，V 。 假 设 已 知 所 有 输入 和 它们 的 补 ， 使 用 NFET 和 PFET 画 出 可 恢复 逻辑 门 电 
路 原理 图 ， 实 现 图 4-23c 所 示 的 异 或 门 。 

CMOS 电路 原理 图 ，VL。 假设 已 知 所 有 输入 和 它们 的 补 ， 使 用 NFET 和 PFET 画 出 可 恢复 逻辑 门 电 
路 原理 图 ， 实 现 一 个 5 输入 反 相 择 多 函数 。 

CMOS 电路 原理 图 ， 仁 。 假 设 已 知 所 有 输入 和 它们 的 补 ， 使 用 NFET 和 PFET 画 出 可 恢复 逻辑 门 电 
路 原理 图 ， 实 现 当 cba =001, 010, 011 或 101 ( 斐 波 那 契 数列 ) 时 ， 函 数 F= 1。 

CMOS 电路 原理 图 ， 妞 。 假设 已 知 所 有 输入 和 它们 的 补 ， 使 用 NFET 和 PFET 画 出 可 恢复 逻辑 门 电 
路 原理 图 ， 实 现 当 cha =0 或 其 中 2 个 输入 为 真 时 ， 函 数 /=0。 

CMOS 电路 原理 图 ， 区 。 假 设 已 知 所 有 输入 和 它们 的 补 ， 使 用 NEFET 和 PFET 画 出 可 恢复 逻辑 门 电 
路 原理 图 ， 实 现 当 cha 中 有 1 个 或 2 个 输入 为 真 时 ， 函 数 f=1。 

CMOS 电路 原理 图 ，X 。 假 设 已 知 所 有 输入 和 它们 的 补 ， 使 用 NFET 和 PFET 画 出 可 恢复 逻辑 门 电 
路 原理 图 ， 实 现 当 deba s0010, 0011, 0101, 0111, 1011, 1101 (4 位 素数 ) 时 ， 函 数 /=0。 

把 CMOS 电路 转化 成 逻辑 等 式 ，T 。 写 出 图 4-28a 所 示 CMOS 电路 实现 的 逻辑 函数 。 





x € q] 
x z] x 
d NFETs 
x SZ 
b) c) 
图 4-28 习题 4.30、 习 题 4.31 和 习题 4. 32 的 CMOS 电路 。 假 设 已 经 正确 实现 了 NFET 和 


PFET 单元 
把 CMOS 电路 转化 成 逻辑 等 式 ， 卫 。 写 出 图 4-28b 所 示 CMOS 电路 实现 的 逻辑 函数 。 
把 CMOS 电路 转化 成 逻辑 等 式 ， 肝 。 写 出 图 4-28c 所 示 CMOS 电路 实现 的 逻辑 函数 。 
三 态 缓冲 器 。 由 4 个 相连 的 三 态 反 相 器 实现 的 逻辑 ， 如 图 4-25c 所 示 ， 描 述 这 种 逻辑 的 两 种 静态 
实现 ,第 一 种 描述 中 只 包含 一 个 门 ， 第 二 种 描述 中 要 包含 多 个 门 。 


1 
78 


第 5 章 | 


Digital Design: A Systems Approach 


CMOS 电路 的 延迟 和 功 耗 





典型 数字 系统 的 设计 规格 不 仅 包 括 功能 ， 还 包括 系统 的 延迟 和 功 耗 〈 能 耗 ) 。 例 如 ， 一 个 
加 法 器 的 设计 规格 描述 如 下 : 1) 功能 ,输出 是 两 个 输入 之 和 ; 2) 延 时 ， 输 入 稳定 后 1 ns 内 ， 
输出 必须 有 效 ; 3) 能 耗 ， 每 次 加 法 运算 所 消耗 的 能 量 不 超过 2 pJ。 本 章 将 介绍 估算 CMOS ;2 
辑 电路 延迟 和 功 耗 的 简单 方法 。 


5.1 静态 CMOS 门 的 延迟 

图 5-1 中 ,逻辑 门 的 延迟 ， 是 指 从 输入 电压 位 于 WV 和 V, 之 间 中 点 (50% 的 点 ) 算 起 到 输 
出 达到 相同 电压 所 需要 的 时 间 。 用 这 种 方式 定义 延迟 ， 我 们 就 可 以 通过 对 每 个 门 的 延迟 进行 简 
单 相 加 来 计算 一 连 串 的 逻辑 门 的 总 延迟 。 例 如 ,在 图 5-1 中 ， 从 a F) c 的 延迟 是 两 个 门 的 延迟 
相 加 。 第 一 个 反 相 器 输出 电压 的 中 点 也 是 第 二 个 反 相 器 输入 电压 的 中 点 。 

因为 PFET 上 拉 网 络 的 电阻 与 NFET 下 拉 网 络 的 电阻 不 同 ， 所 以 CMOS 门 的 上 升 延迟 与 下 
降 延 迟 不 同 。 当 两 个 延迟 不 相等 时 ， 从 输入 电压 下 降 到 V, 的 50% 算 起 到 输出 电压 上 升 到 V, 的 
50% 的 这 段 时 间 称 为 上 升 延迟 ， 记 为 ,,， 下 降 延 迟 记 为 ,， 如 图 5-1 所 示 。 


bN 05 - 
@= 
图 5-1 延迟 时 间 的 测量 是 从 输入 电压 变化 50% 到 产生 输出 电压 变化 50% 时 所 需 的 时 间 。 图 中 
显示 了 输入 a 和 输出 ON 的 波形 ， 下 降 延 迟 只 和 上 升 延 迟 r, 

我 们 可 以 使 用 4. 2 节 中 推导 出 的 简单 开关 模型 ， 通 过 计算 电路 的 RC 时 间 常 数 来 估算 和 i， 
RC 时 间 常 数 由 驱动 门 的 输出 电阻 和 驱动 门 负载 的 输入 电容 计算 得 出 。” 因为 这 个 时 间 常 数 与 驱动 
门 和 接收 门 都 有 关 ， 所 以 我 们 不 能 由 一 个 门 来 确定 延 时 ， 时 间 常 数 只 能 是 输出 负载 的 函数 。 

思考 这 样 一 个 例子 ， 一 个 CMOS 反 相 器 的 上 拉 PFET 宽度 是 Wp, Fj NFET 宽度 是 Wy, 
它 驱 动 同 样 一 个 反 相 器 ， 如 图 5-2a 和 图 5-2b a.” 在 上 升 沿 和 下 降 沿 ， 第 二 个 反 相 器 的 输入 
电容 是 PFET 和 NFET 的 电容 之 和 Ca = ( WW, + WW、) Cc。 当 第 一 个 反 相 器 输出 上 升 时 ， 输 出 电阻 
等 效 为 宽度 为 W, 的 PFET 的 电阻 ， 如 图 5-2c 所 示 : Re =Ke/ Wp =KbpKry/Ws。 这 样 ， 在 上 升 沿 
得 到 : 
Ky Kyy( W, + Wy) Co 
nv 7 — e (5-1) 


O 实际 上 ， 了 驱动 门 也 有 输出 电容 ， 其 值 与 输入 电容 大 致 相等 ， 这 里 为 了 简化 模型 省 略 了 输出 电容 。 
© Wp 和 Ww 以 Wain =8L,i, 为 单位 ; Ce 是 宽度 为 8L,i, 的 门 的 电容 ， 所 以 Co =0. 22 fF. 


# 53% CMOS EHH :g PAH 57 





类 似 地 ， 在 下 降 沿 ， 输出 电阻 是 NFET 的 下 拉 电 阻 ， 如 图 5-2d 所 示 : Ry = Ke Wo 下 降 


JERE: 
_ Ky (Wp + Wy) Co 





bat = R,C,,, W. (5-2) 
W, Wp 
a bN É 
a pe bN x è Wy Wy 
Wy Wy 
a) b) 
Krp/ Wp 
(Wp +tWy) Ce 

P iiaia w G 

c) d) 


图 5-2 驱动 相同 反 相 器 的 反 相 器 延迟 。a) 逻辑 电路 图 (图 中 标注 的 数据 都 是 器 件 的 宽度 ) 。 

b) 晶体 管 级 电路 。e) 计算 上 升 延 迟 的 开关 级 模型 。d) 计算 下 降 延 迟 的 开关 级 模型 
大 多 数 情况 下 ， 我 们 和 希望 规定 CMOS 门 的 大 小 ， 这 样 就 可 以 使 上 升 延 迟 和 下 降 延 迟 相等 ， 即 
te =tyo MUL 5-3 所 示 的 反 相 器 ， 隐 含 着 W, =K, Wy, PRET 的 宽度 是 NFET 宽度 的 K, 倍 ， 这 说 
HH PFET 的 电阻 率 (每 平方 单位 ) 是 NFET 电阻 率 的 K, ffo PFET 上 拉 电 阻 为 R, = Ka ZW, = 
《天 py 全 = K,N/Wy =R, 即 电阻 相等 ， 因此 延迟 也 相等 。 用 K Wy 替代 上 面 公式 中 的 

W, 得 到 : 

Kas 


tc = y (Ke +1)W,C, = (K, +1) K. G, = (Kp +1) ty (5-3) 
N 
K K 
tl " T Ka EC 
a) b) 


图 5-3 具有 相等 上 升 / 下 降 延 迟 的 一 对 反 相 器 。a) 逻辑 电路 图 (图 中 参数 所 对 应 的 大 小 见 
表 4-1)。b) 下 降 延 迟 的 开关 级 模型 (与 上 升 延迟 的 开关 级 模型 相同 ) 

注意 ,分子 分 母 上 的 W. 相互 抵消 。 驱 动 一 个 相同 反 相 器 的 
反 相 器 延迟 iu 取决 于 器 件 宽 度 。 随 着 器 件 变 宽 ，R 减少 ，C 
增 大 ， 总 延迟 RC 不 变 。28 nm 工艺 模型 中 K, =1.3, #EjR E: 
2.37, =2.7 pso® 
例 5-1 上 升 时 间 和 下 降 时 间 

如 图 5-4 所 示 的 与 -或 - 非 门 ， 它 驱动 一 个 FO4 (C,, = 
4C,,,) 反 相 器 ， 假 设 同 一 时 间 只 有 一 个 输入 发 生变 化 ， 计 算 
与 -或 - 非 门 的 最 大 上 升 /下 降 时 间 和 最 小 上 升 /下 降 时 间 ， 图 5 4 例 51 使 用 的 与 -或 ~ 非 | 





日 ”对 于 具有 Wy =8Lwis 的 最 小 反 相 器 ， 上 升 和 下 降 延 迟 相等 ， 在 我 们 的 模型 工艺 里 Ciw =0.5 fF. 
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当 输 入 abe 从 000 变化 为 100 时 ， 下 降 时 间 最 小 ， 因 为 在 下 拉 路 径 上 这 个 开关 只 有 一 个 蝇 
SFM, ARBSAAC,,, Wey, =4i,,,。 当 输入 abe KOLO KOOL 变化 为 011 时 ， 下 降 时 间 最 大 ， 
此 时 下 拉 路 径 中 有 两 个 NFET 导 通 ， 延 迟 是 下 拉 路 径 中 只 有 一 个 NFET 时 的 两 倍 ， 即 tima = Blinc 

当 输 入 abe 从 100 变化 为 000 H, Ete a), that, Wa 控制 的 PFET 导 通 ， 其 他 两 个 
PFET 也 是 导 通 的 。 因 此 ， 等 效 串 联 电阻 R=1.5Ks、， 负 载 电 容 为 4C;,， 则 4, =6t,,. BMA 
abc 从 101 变化 为 001 (或 从 110 变化 为 010) 时 ， 上 升 时 间 最 大 。 在 这 种 情况 下 ， 只 有 两 个 并 
联 的 PFET 导 通 ，R =2Kyy, WW bom =S o 


5.2 扇 出 和 驱动 大 电容 负载 

思考 这 样 一 个 例子 ， 一 个 大 小 为 1 (WW、= Wain) ABR A, SEK) W, =K Wu) 能 保证 
上 升 / 下 降 延 迟 相等 ， 用 该 反 相 器 驱动 4 个 相同 的 反 相 器 ， 如 图 5-5a 所 示 。 计 算 RC 时 间 常 数 
的 等 效 电 路 如 图 5-5c 所 示 。 扇 出 为 4 的 反 相 器 与 相同 反 相 器 〈 扇 出 为 1) 具有 相同 的 驱动 电阻 
RN ， 但 是 负载 电容 是 相同 反 相 器 的 4 倍 ， 即 4Ci。 这样 得 到 的 结果 是 : 扇 出 为 4 的 电路 延迟 是 
扇 出 为 1 的 4 倍 。 一 般 来 说 ， 局 出 为 下 的 电路 延迟 是 扇 出 为 1 09 F fE: 

tp = Ft,, (5-4) 

AR, F=4 时 ， ú =4i,, =10.8 ps, IHX 4 的 电路 (F04) 延迟 常用 来 比较 工艺 的 优 劣 ， 
设计 者 在 表示 时 间 周 期 和 逻辑 深度 时 常常 会 用 FO4 延迟 (u) 作为 参照 。 

如 果 单 位 大 小 的 反 相 器 驱动 一 个 4 倍 大 小 的 反 相 器 ， 如 图 5-5b 所 示 ， 则 延迟 与 驱动 4 个 相 
同 反 相 器 的 情形 相同 。 第 一 个 反 相 器 的 负载 电容 仍然 是 输入 电容 的 4 倍 。 


K, 
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a) c) 
图 5-5 — CHAS oH BJ f BE F| Pr f 3800 4 倍 : a) 驱动 另外 4 个 反 相 器 ; b) 驱动 一 个 大 
(4 倍 大 ) 反 相 器 ; e) 下 降 延 迟 的 开关 级 模型 I 
当局 出 非常 大 时 ,分 级 而 不 是 一 次 性 提高 信号 的 驱动 能 力 ， 这 样 得 到 的 延迟 与 扇 出 是 对 数 
关系 ， 而 不 是 线性 关系 。 思 考 图 5-6a 所 示 的 情况 ， 由 单位 大 小 的 反 相 器 ”产生 信号 ON, SK oH 
的 负载 是 单位 大 小 反 相 器 的 1024 倍 (局 出 =1024)。 如 果 把 bN 和 xN 简单 地 用 导线 连接 起 
来 ， 延 迟 就 是 10241,,,。 如 果 提 高 每 级 的 驱动 能 力 ， 如 图 5-6b 所 示 ， 电 路 分 为 5 级 ， 每 级 的 遍 
出 都 是 4， 这 样 就 得 到 总 延迟 20t, FE 10244,, 小 很 多 。 
一 般 来 说 ， 如 果 把 一 个 扇 出 为 眉 的 电路 分 成 于 级 ， 每 级 的 肩 出 为 w = 严 ”， 则 延迟 是 
ts, = nF" tn = Qt log F (5-5) 
通过 对 公式 (5-5) 中 的 nn 或 a 求 导 并 令 导 数 等 于 0， 就 可 以 求 得 最 小 延迟 ， 即 每 级 的 扇 出 a = 
e 时 ， 延 迟 最 小 。 实 际 上 ， 扇 出 在 3 和 6 之 间 结 果 最 好 。 扇 出 比 3 小 会 导致 级 数 太 多 ， 而 肩 出 


O 从 现在 开始 ， 当 门 的 大 小 被 设计 成 上 升 延迟 和 下 降 延 迟 相 等 时 ， 我 们 就 会 省 略图 中 的 Wp 
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a bN ë dN e 


图 5-6 驱动 大 电容 负载 。a) 单位 大 小 反 相 器 的 输出 驱动 扇 出 为 1024 的 电路 ,“?” 这 里 需要 
一 个 用 来 缓冲 信号 UN、 驱动 大 电容 的 电路 。b) 通过 使 用 一 系列 大 小 按 比例 〈 此 处 为 
4) 增加 的 反 相 右 来 提高 每 一 级 的 驱动 能 力 ， 从 而 使 延迟 最 小 
大 于 6 会 造成 每 级 延迟 太 长 。 实 际 中 经 常 使 用 的 扇 出 为 4。 总 的 来 说 ， 驱 动 一 个 具有 大 扇 出 F 
的 电路 时 ， 使 用 多 级 ， 每 级 的 扇 出 为 w， 这 样 ， 延 迟 与 扇 出 严 的 关系 就 从 线性 增长 变 为 对 数 增 
长 ， 即 log。.f， 从 而 降低 了 延迟 。 


例 5-2 MH 

一 个 最 小 的 反 相 器 驱动 负载 125Ci,， 每 级 的 扇 出 为 5， 计 算 所 需 延 迟 。 

在 这 个 实例 中 ， 我 们 分 为 3 级 ， 最 小 的 反 相 器 驱动 一 个 大 小 是 最 小 反 相 器 5 倍 大 小 的 反 相 
器 ， 然 后 再 驱动 一 个 大 小 是 最 小 反 相 器 25 倍 的 反 相 器 ， 最 后 共同 驱动 负载 。 每 级 的 延迟 是 
Sti, BIER 15t,,, 0 


5.3 ARMIES IR 


就 像 鹿 出 可 以 通过 增加 负载 电容 增加 延迟 一 样 ， 扇 人 可 以 通过 增加 输出 电阻 或 者 是 等 效 输 
入 电容 增加 门 延迟 。 为 了 保持 输出 驱动 不 变 ， 我 们 改变 多 输入 门 上 晶体 管 的 大 小 ， 以 保证 上 拉 
串联 电阻 和 下 拉 串 联 电阻 等 于 具有 相等 上 升 / 下 降 延 迟 的 反 相 器 的 电阻 。 
例如 ， 一 个 2 输入 与 非 门 驱动 一 个 相同 的 与 非 门 ， 如 图 5-7a 所 示 。 我 们 确定 每 一 个 与 非 
门 中 器 件 的 大 小 ， 这 样 可 以 使 上 拉 和 下 拉 网 络 的 输出 电阻 与 具有 单位 驱动 的 反 相 器 (上 升 / 下 
降 延 迟 相等 ) 的 电阻 相同 ， 如 图 5-7b 所 示 。 在 最 坏 的 情况 下 ， 只 有 一 个 上 拉 PFET 打开 ， 我 们 
规定 这 些 PFET 的 大 小 是 W, =K， 此 时 就 和 反 相 吉 中 的 一 样 。 输 出 高 电 平 不 能 完全 归 因 于 两 个 
PFET 的 并 联 ， 因 为 这 两 个 PFET 同时 导 通 (输入 为 低 电 平 ) 只 是 实现 输出 为 高 的 三 种 输入 状态 
中 的 其 中 之 一 。 为 了 让 下 拉 电 阻 等 于 RN ， 串 联 的 每 个 NFET 的 宽度 是 最 小 宽度 的 两 倍 。 如 图 S-7e 
所 示 ， 把 两 个 电阻 为 R./2 的 器 件 串 联 得 到 总 下 拉 电 阻 为 RN。 具有 单位 驱动 的 与 非 门 的 每 个 输 
和 人 电容 是 PFET 和 NFET 电容 之 和 : 
(2 +K,)C, = 7+ *te 
I +K," 
2 输入 与 非 门 的 输入 电容 与 能 够 提供 相同 输出 驱动 的 反 相 器 的 输入 电容 的 比值 称 为 2 输入 
与 非 门 的 逻辑 功效 (logical effort) 。 它 表示 实现 2 输入 与 非 门 逻辑 函数 的 功效 (与 一 个 反 相 响 
相 比 ， 必 须 移动 更 多 电荷 ) 。 驱 动 相 同类 型 的 门 时 (如 图 5-7a 所 示 ) ， 其 产生 的 延迟 等 于 逻辑 
功效 与 如 的 乘积 。 
一 般 来 说 ， 如 果 一 个 与 非 门 房 入 为 ,PFET 和 NFET 的 大 小 分 别 为 K, 和 下 ， 那 么 输入 电 
容 为 : 








F + 
Crann = (F +K,)C, 3 


I -6 
1 +K, Ks) 


逻辑 功效 为 : 
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ee ar 
b 2 
a) (K+2)C;=14C,, 
b 
(K +2)C;=1.4C,, 
RV2 + 
R,/2 
c) 


图 5-7 a) 一 个 与 非 门 驱动 男 一 个 相同 的 与 非 门 ， 两 个 与 非 门 的 大 小 使 得 上 升 延 迟 都 等 于 
FREIER, b) 晶体 管 级 原理 图 。c) 开关 级 模型 





(5-7) 
NAND 1 +K, 
驱动 相同 与 非 门 的 延迟 : 
F + K, 
tyann = LEyanptiny = (5-8) 





t; 
1 + K, ™ 
对 于 或 非 门 ，NFET 并 联 ， 具 有 单位 驱动 的 或 非 门 中 NFET 大 小 为 1; PFET 串联 ， 扇 人 为 

F 的 单位 驱动 或 非 门 中 PFET 的 大 小 是 FW,。 则 总 输入 电容 为 : 


1 + FK, (5-9) 
1 + K, any 





Cyon = (1 + FK,)Cç = 

逻辑 功效 为 : 
1 + FK, 
1+K, 
为 了 便于 参考 ， 表 5-1 给 出 了 与 非 门 和 或 非 门 在 扇 人 从 1 变化 到 5 时 ， 扇 人 与 逻辑 功效 之 
闻 的 函数 关系 。 表 中 给 出 了 以 K, 为 参量 的 函数 表达 式 及 K, = 1.3 时 所 对 应 的 数值 (此 值 适用 





LE yon = (5-10) 






































于 28 nm 工艺 )。 
表 5-1 对 于 与 非 门 和 或 非 门 ， 逻 辑 功 效 是 扇 入 的 函数 (忽略 源 极 / 漏 极 电容 ) 
逻辑 功效 
ps f (Kp) K; =1.3 
与 非 或 非 与 非 或 非 
1 1 1 1.00 1.00 
e Ky 1 +2K, 
2 I +K, 14K, 1. 43 1.56 
3 +Kp 1+3Kp 
3 II +K, 1 *K, 1.87 2.13 
4 +K, 1 +4Kp 
4 1+Kp Tek, 2. 30 2.70 
5 +Kp 1+5Kp 
5 1+Kp I +K, 2.74 3. 26 


pi 用 类 似 方法 可 以 计算 复杂 门 的 逻辑 功效 。 图 5-8 是 一 个 3 输入 与 -或 - 非 (AO N, 它 


85 | 的 大 小 与 最 小 反 相 器 的 驱动 能 力 相 匹配 。 三 个 输入 的 输入 电容 不 同 ， 逻 辑 功效 必须 分 别 计 算 。 
ËB E, 对 于 输入 a; 


1 +2K 
elle (5-11) 


Cora = (1 +2K,)C, = I] + K. “iw 
P 
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LE _ 1 +2K, (5-12) 
AOl,a 1 + K, 
对 于 输入 5 和 <: 

C = (242K > 2 + 2K, 
aorte = (2 + 2Kp) Ce = 77g C (5-13) 

P 
LE _2+2K, -9 (5-14) 

AOL, b,c 1 + K, 


Pl 5-3 人 逻辑 功效 
计算 图 5-9 所 示 的 2-2 或 -与 - 非 门 的 逻辑 功效 。 





a) 
图 5-8 与 -或 - 非 (AOL) 门 的 逻辑 功效 。 图 5-9 最 小 的 与 -或 - 非 门 
a) 门 符号 。b) 晶体 管 级 原理 图 ， 
器 件 大 小 经 设计 可 确保 上 升 / 下 降 延 
迟 相等 ， 具 有 单位 驱动 力 
此 门 中 ,每 个 输入 的 输入 电容 为 : 





Coa = 242K, 
逻辑 功效 为 : 
= 2 + 2K, = 
I l + K, 


5.4 延迟 计算 

在 逻辑 电路 中 ,第 i 级 到 第 i+1 级 的 肩 出 或 电 功 效 (electrical effort) 乘 以 第 i+1 RAW 
辑 功效 得 到 第 i 级 延迟 。 扇 出 是 第 i 级 与 第 i+1 级 的 驱动 力 之 比 。 逻 辑 功效 是 应 用 到 第 i+1 级 
输入 的 电容 放大 器 ， 用 来 实现 当前 阶段 的 逻辑 功能 。 

例如 ， 如 图 5-10 所 示 的 逻辑 电路 。 在 同一 时 间 ， 计 算 从 a 到 。 每 一 级 的 延迟 ， 如 表 5-2 所 
示 。 第 一 级 驱动 信号 UNW， 扇 出 是 4， 下 一 级 〈 反 相 器 ) 的 逻辑 功效 是 1。 所 以 这 一 级 的 总 延迟 
是 44,,。 第 二 级 驱动 信号 <， 本 级 和 下 一 级 驱动 能 力 都 是 4， 所 以 扇 出 是 1。 信号 < 驱动 一 个 3 
输入 或 非 门 ， 它 的 逻辑 功效 是 2. 13 ， 所 以 这 一 级 的 。、 py I. 。 , 
总 延迟 是 2.13。 第 三 级 驱动 信号 dN， 既 有 筷 册 有 “0 d> > av) >“ 
泌 辑 功效 。 这 一 级 的 肩 出 是 2 (4 个 驱动 8 个 ) Z k 
辑 功效 是 2 输入 与 非 门 的 逻辑 功效 ， 值 为 1.43， 总 图 5-10 用 于 延迟 计算 的 逻辑 电路 。 每 个 门 


延迟 是 2 x 1.43 =2.86。 最 后 是 第 四 级 驱动 信号 e, 下 面 所 标的 数值 代表 该 门 相 对 于 具 
RAE 4, CE 1。 我 们 不 计算 最 后 一 个 反 相 有 相同 上 升 /下 降 延 迟 的 最 小 反 相 


器 的 延迟 ( 驱动 能 力 是 32)。 这 里 只 是 简单 地 为 信 器 ， 所 呈现 出 的 驱动 能 力 (电导 ) 
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号 e 提供 了 一 个 负载 。 总 延迟 是 四 级 延迟 相 加 : ta = (4 +2. 13 +2. 86 +4)z,,, = 13. 0t, =35 ps, 


表 5-2 计算 逻辑 电路 的 延迟 。 沿 着 路 径 的 每 一 级 ， 计 算 信 号 的 扇 出 和 接收 信号 门 的 逻辑 功效 。 
扇 出 乘 以 逻辑 功效 得 到 每 一 级 的 延迟 ， 把 各 级 的 延迟 相 加 得 到 总 延迟 ， 用 tv 表示 





驱动 i 信号 /到 i+ 扇 出 /到 i+ 逻辑 功效 i+1 延迟 /到 i+1 
1 bN 4. 00 1. 00 4.00 
z c 1.00 2. 13 2.13 
3 dN 2. 00 1.43 2.86 
4 e 4. 00 1 4. 00 
总 计 13.0 


当 使 用 扇 人 计算 一 个 电路 的 最 大 延迟 时 ， 需 要 确定 最 长 〈 或 关键 ) AE RINE A E 


[87] 用 这 种 方法 〈 如 表 5-2 所 示 ) 计算 延迟 并 取 最 大 值 。 例 如 ， 在 图 5-11 中 ,假设 输入 信号 a 和 p 


在 同一 时 间 变 化 ，t =0。 延 迟 的 计算 过 程 如 表 5-3 所 示 。 从 a 到 < 的 延迟 是 7.73tiw， 从 卫 到 YN 
的 延迟 是 1. 87iws 当 计算 最 大 延迟 时 ， 关 键 路 径 就 是 从 a 到 < 再 到 dN 一 一 总 延迟 是 15. 731;,,。 
如 果 关 心 电 路 的 最 小 延迟 ,那么 就 使 用 从 P 到 gN 再 到 dN 的 路 径 一 一 总 延迟 是 9. 871... 

一 些 逻 辑 电路 中 包括 扇 出 到 不 同门 类 型 的 逻辑 门 ， 如 图 5-12 中 的 信号 g。 在 这 种 情况 下 ， 
对 于 每 个 被 驱动 门 ， 计 算 每 个 扇 出 的 电 功 效 和 逻辑 功效 ， 再 把 这 些 乘 积 相 加 得 到 信号 g 的 总 延 
迟 。 上 面 的 与 非 门扇 出 是 3， 逻 辑 功效 是 1.87， 总 功效 是 5.61。 下 面 的 或 非 门 扇 出 是 2， 逻 辑 
功效 是 1.56， 总 功效 是 3. 12。 这 样 ， 信 号 g 的 总 延迟 (或 者 功效 ) Æ 8. Tto 


表 5-3 计算 图 5-11 中 两 条 路 径 的 延迟 








信号 i 到 i+1 扇 出 /到 i+1 逻辑 功效 i+1 延迟 /到 i+1 

bN 0. 25 l 0.25 
c 4 1. 87 7.48 
a 到 c 的 延迟 小 计 7.73 
qN l 1. 87 1. 87 
p 到 aN 的 延迟 小 计 1. 87 
dN 8 l 8 

a 到 dN 的 延迟 总 计 15. 73 
p 到 dN 的 延迟 总 计 9. 87 





a bN c an 
p i qN l t k; 
4 
图 5-11 标 有 扇 人 的 逻辑 电路 。 输 入 ec Hp fE 图 5-12 由 不 同类 型 且 标 出 扇 出 的 门 组 成 的 逻辑 
同一 时 间 变 化 。 最 大 延迟 的 关键 路 径 电路 。 每 个 接收 门 的 扇 出 与 逻辑 功效 相 
是 从 a 到 < 再 到 dN He, 然后 把 这 些 乘积 相 加 得 到 信号 z 的 


总 功效 
例 5-4 延迟 计算 

计算 图 5-13 所 示 逻 辑 电路 的 延迟 ， 该 电路 为 图 8-5 中 6 :64 译 码 器 的 一 路 。 这 个 电路 驱动 
负载 的 大 小 是 256C,,,。 每 级 的 肩 出 已 经 标 出 。 信 号 5b 驱动 一 个 大 小 是 最 小 反 相 器 2 倍 的 反 相 器 
和 两 个 2 输入 或 非 门 P。 信 号 c 驱动 两 个 P (RT); d 驱动 16 个 Q (与 非 门 )。 表 5-4 列 出 
了 2 输入 或 非 门 P 和 3 输入 与 非 门 Q 的 逻辑 功效 。 
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FO=2 x P 





图 5-13 ”用 于 例 5-4 延迟 计算 的 电路 


延迟 计算 如 表 5-4 所 示 。 把 下 一 级 中 每 种 类 型 门 的 扇 出 、 逻 辑 功 效 、 大 小 相 乘 ， 再 把 所 有 
乘积 相 加 ， 得 到 每 级 的 负载 。 延 迟 等 于 负载 除 以 驱动 数 ， 单 位 是 Lao 


表 5-4 5-13 所 示 电 路 的 延迟 计算 
















信 号 ”驱动 数 RE (Civ) HEIR (t) 信 号 。 驱动 数 负载 (Ca) 延迟 (le) 
b 2x 24+2x1.56x8=27.0 13.5 4x 32 8 
c 2x 2 x 1.56 x8 =25.0 12.5 32 x 256 8 





8x 16 x 1. 87 x4 =120 15.0 


5.5 延迟 优化 


为 了 使 逻辑 电路 的 延迟 最 小 ， 我 们 规定 每 级 门 的 大 小 ， 使 得 每 级 的 延迟 相等 。 对 于 一 条 n 
级 路 径 ， 实 现 优 化 的 一 个 简单 方法 是 沿 着 路 径 计算 总 功效 ，TE， 然 后 规定 每 级 门 的 大 小 使 总 
功效 均匀 地 分 配 在 每 级 ， 每 级 的 总 功效 〈( 扇 出 和 逻辑 功效 的 乘积 ) 是 TE”。 

例如 ， 图 5-14 的 电路 。 这 个 电路 的 延迟 计算 如 表 5-5 所 示 。 第 一 个 和 最 后 一 个 门 的 大 小 比 
值 确定 了 总 扇 出 为 96。 我 们 把 该 电 功 效 96 乘 以 第 3 级 的 逻辑 功效 1.43 ， 再 乘 以 第 4 级 的 逻辑 
功效 1. 87， 得 到 总 功效 为 237， 然 后 把 257”=~4 作为 每 级 的 总 功效 (延迟 )。 门 的 电 功 效 等 于 
每 一 级 的 功效 4 除 以 逻辑 功效 。 这 样 ， 门 大 小 是 x=4, y=4x4/1.43 =11.2, z=24.0。 总 延迟 
略 大 于 16¢,,., 0 


表 5-5 优化 门 的 大 小 使 延迟 最 小 ， 总 功效 被 均匀 地 分 配 在 每 级 








驱动 i 信号 i 到 i+1 扇 出 i 到 i+1 逻辑 功效 i+1 大 小 /i 延迟 i 到 i+1 
1 bN 4.00 1.00 l x=4 

2 c 2. 80 1. 43 4 1. 43y/x =4 
3 dN 2.14 1. 87 11.2 1. 87z/y =4 
4 e 4 l 24.0 96/z =4 
总 计 16 


假如 图 5-14 中 的 最 后 一 个 反 相 器 驱动 总 局 出 为 2048 而 不 是 96, 结果 会 如 何 。 假 如 这 样 ， 
总 功效 TE =2048 x1.43 x1.87 二 5477。 如 果 把 它 分 成 四 级 ， 得 到 每 级 的 延迟 是 5477' ~8. 61,,， 
这 个 值 有 点 儿 大 ， 总 延迟 大 约 是 34. 41;,,。 在 这 种 情况 下 ， 可 以 通过 增加 偶数 个 反 相 器 来 降低 
延迟 ， 就 像 图 5-6 的 例子 一 样 。 最 优 级 数 是 ln5477=8。8 级 ， 每 级 的 功效 必须 是 2. 93 ， 总 延迟 
是 23.44。 电 路 经 折 中 后 ， 每 级 延迟 要 达到 


4， 需 要 log,5477 ~6 级 ， 总 延迟 是 25.21,。 7 ; BN š dN ° a 
如 果 想 要 在 图 5-14 的 电路 中 增加 两 个 $ ' 

或 四 个 反 相 器 ， 必 须 确定 增加 的 位 置 。 我 psi 门 的 大 小 未 固定 的 逻辑 电路 ， 如 果 需 要 ， 可 以 

们 可 以 在 不 改变 功能 和 延迟 的 情况 下 在 电 使 每 级 的 延迟 相等 和 增加 级 数 ， 对 三 个 中 间 


路 的 任意 位 置 插入 一 对 反 相 器 。 如 果 我 们 级 门 的 大 小 x，y 和 = 进行 选择 ， 使 延迟 最 小 
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想 把 与 非 门 转化 成 或 非 门 ， 甚 至 可 以 在 任意 位 置 插入 若干 反 相 器 (这样 会 提高 总 功效 ， 所 
以 不 是 一 个 好 方法 ) 。 但 是 ， 最 好 把 增加 的 电路 放 在 最 后 ， 这 样 可 以 避免 电路 中 旭 辑 功效 高 
的 那些 级 中 的 门 的 大 小 进一步 增 大 ， 从 而 产生 更 多 的 能 耗 。 如 果 一 个 信号 有 很 大 的 连 线 负 
载 ， 那 么 增加 一 个 或 更 多 额外 的 级 是 有 利 的 ， 但 是 在 增加 之 前 ， 要 确保 连 线 有 足够 的 驱动 
能 力 。 

在 讨论 延迟 优化 中 ,我 们 忽略 了 逻辑 门 的 自身 〈 寄 生 ) 电容 。 如 果 把 这 点 考虑 到 模型 中 ， 
除了 增加 每 个 门 的 延迟 ， 还 有 两 个 方面 的 影响 。 首 先 ， 因 为 增加 级 数 的 成 本 大 ， 所 以 每 级 最 优 
功效 是 3 ~4 而 不 是 e。 其 次 ， 扇 人 大 会 导致 门 延 迟 非常 大 。 例 如 ，64 输入 与 非 门 会 有 65 个 连 
接 到 输出 节点 的 晶体 管 ， 所 以 不 要 构建 高 请 人 门 。 

例 5-5 优化 延迟 

重新 定义 例 5-4 中 的 门 的 大 小 ， 使 延迟 最 小 。 驱 动 信 号 上 和 的 输入 反 相 器 大 小 必须 是 最 
小 反 相 器 的 2 倍 。 

从 c 点 开始 ， 假 设 门 是 单位 大 小 ， 每 级 的 门扇 出 (驱动 门 的 数量 ) 乘 以 下 一 级 的 逻辑 功效 
可 以 得 到 总 功效 。 

从 表 5-6 中 可 以 看 出 ， 由 访 出、 逻辑 功效 可 以 得 到 总 功效 3.12 x29.9 =93.4。 它 乘 以 增加 的 
负载 128 得 到 总 功效 11.9 x10’。 把 此 功效 均匀 地 分 配 到 4 级 中 ， 得 到 每 级 的 功效 是 (11.9 x 
10°)” =10.5, 


5-6 图 5-13 所 示 电 路 每 级 的 功效 计算 





信号 门扇 出 逻辑 功效 功效 信号 门扇 出 逻辑 功效 功效 
c 2 1. 56 3.12 e 1 1 1 
d 16 1.87 29.9 f 1 1 1 


这 样 ， 我 们 重新 定义 了 门 的 大 小 ， 得 到 每 级 的 总 功效 是 10.5。 最 终 门 的 大 小 和 延迟 如 表 5-7 
所 示 。 比 例 5-4 中 计算 的 总 延 时 减少 了 3.74,,。 


表 5-7 优化 图 5-13 中 每 个 门 的 大 小 和 延迟 


信号 大 小 功效 延迟 信号 大 小 功效 延迟 
b 2 11.5 e 2. 36 1 10.5 
c 2 3.12 10. 5 f 24.8 l 10.3 
d 6. 73 29.9 10. 5 总 计 53.3 





5.6 连 线 延 迟 


在 现代 集成 电路 中 ， 大 部 分 延迟 和 功 耗 是 驱动 互 连 线 产生 的 。 片 上 连 线 具有 电阻 和 电容 ， 
130 nm 和 28 nm 工艺 中 的 典型 值 如 表 5-8 所 示 。 下 面 的 例子 采用 最 小 连 线 ， 我 们 还 将 在 习题 
5. 20c 中 讨论 连 线 电阻 大 小 对 延迟 和 功 耗 产生 的 影响 。 


表 5-8 130 nm 和 28 nm 工艺 中 的 最 小 连 线 的 电阻 和 电容 


参 数 130 nm 值 . 28 nm 值 单 位 描 述 
R, 0. 25 0.45 OPER 每 平方 电阻 
w 0.25 0. 045 um 线 宽 
R, l 10 Q/ pm 每 um 的 电阻 
Cy, 0.2 0. 18 {F/ um 每 um 的 电容 


Ta 0.2 1.8 fs/ um? RC 时 间 常 数 
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当 连 线 很 短 时 ， 与 驱动 门 的 输出 电阻 相 比 连 线 的 总 电阻 很 小 ， 它 可 以 按 集 总 电容 建 模 。 例 
a, fel) (Wy =8L,,,) 反 相 器 输出 电阻 是 5. 25 kOQ。 长 度 小 于 105 um 的 连 线 总 电阻 小 于 这 个 
数 的 五 分 之 一 ， 可 以 把 它 看 成 一 个 集 总 电容 。 例 如 ,长 度 为 105 pm 的 连 线 可 以 建 模 成 19 fF 的 
电容 ， 与 最 小 反 相 器 的 输入 电容 0.52 fF 相 比 ， 相 当 于 扇 出 是 36。 

对 于 较 大 的 驱动 门 ， 较 短 连 线 的 电阻 相当 于 驱动 门 的 输出 电阻 。 例 如 ， 一 个 反 相 器 ， 大 小 
是 最 小 反 相 器 的 16 倍 ， 其 输出 电阻 是 328 Q。 长 度 为 33 um 的 连 线 电阻 等 于 驱动 门 的 输出 电 
阻 ， 要 满足 电阻 小 于 驱动 门 电阻 的 五 分 之 一 时 ， 长 度 必 须 小 于 6.1 pm。 

连 线 很 长 时 ， 它 的 电阻 会 比 驱动 门 电阻 大 很 多 ， 随 着 连 线 长 度 的 增加 ， 连 线 延 迟 会 平方 增 
长 。 如 图 5-15a 所 示 。 随 着 连 线 变 长 ， 连 线 的 电阻 和 电容 线性 增长 ， 同 时 引起 RC 时 间 和 常数 平 
方 增长 。 因 为 连 线 电 阻 决 定 了 总 电阻 ， 所 以 加 大 如 图 5-15b 所 示 驱 动 门 的 大 小 也 不 能 改善 这 种 
状况 。 

我 们 可 以 按照 下 面 的 步骤 计算 1 mm 最 小 连 线 的 电阻 、 电 容 和 内 在 延迟 。 对 分 布 电容 和 电 
阻 建 模 时 ， 如 连 线 ， 延 迟 不 是 RC 而 是 0. 4RC。( 在 计算 中 我 们 忽略 了 输出 电容 。) 

R ia = R.L = (10)(10') = 10 KQ (5-15) 
Cm= CE = (0.18 x10 HI) = 0. 18 pF (5-16) 
D= 0.4RC = 0.4(R. tum) (Cuamm) = 720 ps (5-17) 

为 了 使 长 连 线 延 迟 随 着 长 度 的 增加 而 线性 增长 〈 而 不 是 平方 增长 ) ， 连 线 可 以 分 成 多 个 小 

段 ， 每 段 由 一 个 中 继 器 (repeater) 驱动 ， 如 图 5-15e 所 示 。 








) Ry Ry Rw Ry 
a i 
Cy T Cy T Cy T Cy 
b) KER 
X 1 
c) 
S S S S S 1 


图 5-15 a) 片上 长 连 线 有 很 大 的 串联 电阻 R, 和 并 联 电容 C, ， 延 迟 随 着 长 度 的 增加 而 平方 增 
Ko b) 驱动 长 连 线 会 产生 让 人 无 法 接受 的 延迟 和 上 升 时 间 。 由 于 连 线 电阻 率 的 存 
在 ， 所 以 增加 驱动 门 的 大 小 X 不 会 改善 这 种 情况 。c) 在 连 线 上 的 固定 时 间 间 隔 插入 
大 小 为 5 的 中 继 器 ， 可 以 使 连 线 延 迟 随 着 长 度 增 加 而 线性 增长 ， 而 不 是 平方 增长 


d, 








a) b) 
图 5-16 a) 驱动 一 段 连 线 的 逻辑 图 ， 两 边 是 大 小 为 $ 的 中 继 器 。b) 我 们 使 用 的 延迟 模型 是 
三 个 延迟 之 和 : 连 线 的 内 在 延迟 〈w ) 、 连 线 电容 通过 驱动 电阻 放电 的 时 间 (d) 
和 第 二 个 驱动 门 通过 驱动 门 和 连 线 放电 的 时 间 (d) 
为 了 得 到 线性 延迟 ， 我们 把 长 度 为 的 连 线 分 成 n 段 ,每 段 长 度 为 1=L/n。 在 每 段 结束 部 
分 , 插入 一 个 反 相 器 (或 者 中 继 器 ) 驱动 下 一 级 。 总 延迟 的 近似 值 是 三 个 RC 延迟 之 和 : 连 线 
本 身 的 延迟 、 连 线 电容 通过 驱动 门 电阻 放电 的 时 间 和 下 一 个 驱动 门 的 电容 通过 连 线 和 驱动 门 电 
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阻 放电 的 时 间 。 图 5-16 显示 了 这 个 模型 。 





D, = 0.4R, ,C,, + RG, + C.(R,, +R,) (5-18) 
D, = +0. 4PR,C, + IR,C, + C,(IR, + R,)) (5-19) 
使 用 公式 (5-19) 求 得 每 段 长 度 的 导数 ， 并 使 其 为 0， 就 能 得 到 最 小 延迟 时 的 中 继 器 间距 : 
d R C. _ 1 
alt = 0.4R,C, - zs 0 (5-20) 


tiy —_ 5 


图 5-17a 中 ， 连 线 延迟 随 着 中 继 器 间距 的 变化 而 变化 。 在 间距 很 短 时 ， 主 要 是 中 继 器 的 延 
Ro 一旦 间距 超过 了 60 pm， 延 迟 开始 增加 。 例 如 ， 中 继 器 间距 是 原 间距 8 倍 时 ， 延 迟 是 原来 
的 2 倍 。 我 们 也 可 以 经 过 类 似 步 又 得 到 最 优 中 继 器 大 小 S. 








< L 2 IRC, R,,, 
D,= 5 (o. APRC, + E + SC, (IR. + ==)| (5-22) 
d RC. pam 
TALE R. 0 (5-23) 
s= (5-24) 
D, san = 228 ps (5-25) 


我 们 看 到 ， 不 考虑 段 长 度 时 ， 最 优 的 驱动 门 大 小 是 最 小 反 相 器 的 13.5 倍 ， 随 着 驱动 门 的 
大 小 变 大 ， 延 迟 几乎 不 变 ， 如 图 5-17b 所 示 ， 也 就 是 说 一 旦 驱动 门 的 大 小 超过 了 某 个 国 值 ， 大 
小 对 延迟 的 影响 很 小 。 但 是 ， 大 的 驱动 门 会 增加 功 耗 。 

1 1 





0.9 0.9 
0.8} 0.8 
0.7 x 0.7 
F a, F 0.6 
205 Š 0.5 
g s 
EL 0.4 Hl 0.4 
0.3 0.3 
0.2 0.2 
0.1 0.1 
0 0 — 上 
0 100 20 30 40 500 0 5 10 15 20 25 30 
中 继 器 间距 (hm)， 大 小 =13.5 中 继 器 大 小 ， 间 距 =61pm 
a) b) 


图 5-17 a) 1 mm 连 线 延迟 是 两 个 中 继 器 之 间距 离 的 函数 。b) 中 继 器 间 是 最 佳 间距 时 ，1 mm 连 
线 延 迟 是 中 继 器 大 小 的 函数 。 如 果 没 有 中 继 器 ，1 mm 连 线 延 迟 是 720 ps 


O ”这 是 一 个 非常 简单 的 估计 总 延迟 的 模型 ， 但 是 它 提 供 了 最 优 的 中 继 器 间隔 的 合理 估计 。 对 于 更 精确 和 更 复杂 
的 模型 ， 见 参考 文献 [7] 和 [28]。 
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Gil 5-6 连 线 延迟 
在 28 nm 工艺 中 ,计算 1 mm 最 小 宽度 连 线 的 延迟 ， 连 线 被 分 成 4 段 ， 每 段 连 线 由 10 45 T 
最 小 反 相 器 驱动 。 使 用 表 5-8 和 表 4-1 中 给 出 的 值 计 算 。 
计算 连 线 和 中 继 器 的 电阻 和 电容 步骤 如 下 。 最 小 反 相 器 W. =8L,,,， 所 以 10 倍 于 最 小 反 相 
器 中 W. =80L，。 
R, = 10- x 250 pm = 2500 0 
um 


C = 0.18 E x 250 pm = 45 iy 
pm 


大 RN 4.2 x 10 
R = W. = 80 = 525 0 
C = W,(1 + K,)K. = 80(1 +1.3)2.8 x 10° " = 5.15 fF 
使 用 公式 (5-18)， 计算 每 段 的 延迟 如 下 : 
D,= 0.4R,C, + R.C, + (R, + R,)C, 
= (0.4) (2500) (45) + (525) (45) + (2500 + 525) (5. 15) 
= 45 000 + 23 600 + 15 579 = 84 179 fs 
= 84.2 ps 
在 这 个 例子 中 ， 对 延迟 贡献 最 大 的 是 连 线 自身 延迟 。 
延迟 包括 4 段 的 延迟 ， 即 4D,= (4) (84.2) =337 ps. 


5.7 CMOS 电路 的 功率 损耗 


许多 数字 设计 在 能 耗 、 功 耗 或 两 者 上 都 有 限制 。 电 路 的 能 耗 (单位 : 焦耳 ) 直接 影响 移 
动 设备 的 电池 寿命 或 者 系统 供电 的 成 本 。 功 耗 (单位 : 瓦特 或 焦耳 / 秒 ) 和 电路 产生 的 热量 相 
关 一 一 因此 冷却 系统 十 分 必要 。 冷 却 芯片 方法 不 当时 ， 芯 片 就 会 因 高 温 而 损坏 。 对 于 数字 设计 
者 来 说 ， 理 解 如 何 计算 和 优化 能 耗 和 功 耗 是 十 分 重要 的 。 


5.7.1 动态 功 耗 


CMOS 芯片 中 ， 主 要 能 耗 都 是 由 于 门 电容 和 连 线 电 容 的 充 放 电 。 充 电 时 ， 电 容 上 的 电压 从 

V 到 页 ， 然 后 通过 一 个 电阻 放电 ， 电 容 电压 下 降 并 回 到 V。， 这 个 过 程 中 的 能 耗 为 
E = CV (5-26) 

对 于 28 nm TË, Cm =0.6 fF, V=V, -V, =0.9 V, En =0.49 休 。 也 就 是 说 ， 一 个 最 小 反 相 器 
的 充电 和 放电 消耗 大 约 0. 5 fJ. 

例如 ， 当 输入 a 上 下 循环 变化 时 ， 计 算 如 图 5-10 所 示 电 路 的 能 耗 。 该 输入 循环 变化 影响 
包括 。 在 内 的 所 有 内 部 节点 。 回 忆 一 下 ， 每 个 门 的 输入 电容 等 于 门 的 大 小 〈s*)、 逻 辑 功效 
(LE) 和 Cu 的 乘积 。 则 

E= GV° = V° >; G 





= V°C,, >) s,LE, = En 2, s,LE, 


= E,,(1 +4 + 4LE yom + 8LEyayp + 32) 
= 27.9 fJ 
通常 情况 下 ， 我 们 把 电路 设计 成 每 级 具有 相等 的 延迟 。 就 像 前 面 的 例子 一 样 ， 但 是 ， 能 耗 
是 由 链 路 中 最 大 门 决定 的 。 
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电容 充 放 电 时 的 功 耗 (P = E/ZT=Ef) 取决 于 信号 的 转换 频率 。 具 有 电容 C 的 电路 时 钟 频 

Kf, 每 个 周期 有 a 次 转换 ,” 功 耗 为 : 
P = 0.5CV fa (5-27) 

因子 0.5 是 因为 一 半 功 耗 在 充电 中 ， 另 一 半 功 耗 在 放电 中 。 一 个 反 相 器 ， 活 动因 子 a =0. 33, 
时 钟 频率 f=2 GHz, P=162 nW, 

为 了 降低 电路 的 功 耗 ， 我 们 可 以 降低 公式 (5-27) 中 某 些 项 的 值 。 如 果 降 低 电 压 ， 功 率 呈 
二 次 方 减少 。 但是， 电路 在 低 电 压 下 运行 会 很 慢 。 由 于 这 个 原因 ， 我 们 会 同时 降低 VV 和/,V 
和 /减少 一 半 ， 每 次 功 耗 降低 8 倍 。 通 过 减 小 电路 也 是 减少 电容 常用 的 方法 ， 如 最 小 化 连 线 长 
度 会 减少 连 线 电容 。 

我 们 可 以 通过 一 些 方法 降低 活动 因子 a。 首 先 ， 电 路 不 要 做 没有 必要 的 转换 。 对 于 一 个 组 
合 电 路 ,输入 的 每 次 变化 都 会 造成 每 个 输出 至 少 一 次 转换 ， 应 该 消除 毛刺 或 险象 ( 见 6.10 
节 )， 因 为 它们 会 造成 不 必要 的 功 耗 。 可 以 通过 调整 (停止) 电路 未 使 用 部 分 的 时 钟 来 降低 活 
动因 子 ， 这样 ， 未 使 用 部 分 根本 不 工作 。 例 如 ， 如 果 在 一 个 特定 周期 中 ,没有 用 到 加 法 器 ， 那 
么 停止 加 法 器 的 时 钟 ， 阻 止 加 法 器 的 输入 和 组 合 逻 辑 翻转 ， 从 而 节省 了 大 部 分 功 耗 。 


5.7.2 静态 功 耗 


到 目前 为 止 ， 我 们 都 专注 于 动态 功 耗 一 一 由 于 电容 充 放电 产生 的 功 耗 。 随 着 门 长 度 和 电源 
电压 的 降低 ， 静 态 漏电 (leakage) 功 耗 就 成 为 一 个 越 来 越 重要 的 因素 。 漏 电 电流 是 当 MOSFET 
在 关闭 状态 下 (Ves =0, V, = V,) 流 过 的 电流 ， 漏 电 电流 与 e 成 正比 。 这 样 ， 随 着 阔 值 电 
压 降低 ,漏电 电流 指数 增长 。 通 常 称 这 条 曲线 的 斜率 为 亚 阅 值 儿 率 ， 典 型 值 是 70 mV/ dec, th, 
就 是 说 ， 阐 值 电压 每 降低 70 mV， 漏电 电流 是 原来 的 10 倍 。 电 源 电压 基本 上 已 经 不 再 降低 ， 
因为 更 低 的 电源 电压 要 求 更 低 的 阔 值 电压 ， 这 会 造成 更 高 的 漏电 流 。 

通过 使 用 具有 更 高 Vi 的 晶体 管 可 以 降低 静态 功 耗 。 这 些 唱 体 管 所 付出 的 代价 是 要 么 低速 、 
要 么 更 高 的 电源 电压 (动态 能 耗 ), 或 者 兼 而 有 之 。 许 多 数字 设计 在 关键 路 径 中 使 用 了 低 V, 晶 
体 管 ， 其 他 地 方 使 用 高 V; 晶体 管 。 消 除 漏 电流 的 另 一 个 方法 是 关闭 或 使 用 电源 门 控 电 路 
(power-gate circuit)。 电 源 门 控 在 空间 和 时 间 上 是 粗 粒 度 的 ， 控制 逻辑 在 开关 两 种 状态 循环 会 
耗费 大 量 时 间 。 

思考 这 样 一 个 过 程 ， 调 整 一 个 电路 用 来 适用 于 高 速 应 用 ， 电源 电压 0.9 V， 漏 电 电流 100 
nA/pm。 这 意味 着 每 个 最 小 (更 =224 nm) 晶体 管 消耗 20 nW 的 功率 (已 =IV) 。 商 用 芯片 具 
有 相当 于 10 亿 ~20 亿 个 最 小 反 相 器 ， 使 得 芯片 漏电 功率 达到 20 ~40 W, FETH 60 ~ 120 W 
的 功率 预算 中 占 了 很 大 一 部 分 。 


5.7.3 功率 调节 


CMOS 晶体 管 的 电容 用 工 衡量 。 这 是 因为 并 行 板 电容 的 三 维 尺寸 都 与 也 成 线性 关系 ，C = 
LW/H, 电源 电压 恒定 时 ， 任 何 给 定 逻 辑 模型 的 能 耗 都 与 也 成 比例 。 芯 片 的 能 密度 随 着 1/L 增 
加 ; 也 就 是 说 ， 如 果 工 减 半 ， 单 位 面积 能 耗 是 原来 的 两 倍 。 在 恒定 频率 下 ， 功 率 密度 随 着 1/L 
增加 ， 其 增长 之 快 超过 了 我 们 对 芯片 冷却 的 能 力 。 当 通过 提高 频率 来 提高 性 能 时 ， 这 个 问题 变 
得 更 严重 ， 引 起 功率 密度 增长 1/ 广 。 现 在 许多 设计 者 采用 并 行 技术 ， 较 慢 地 运行 多 个 模块 来 提 
高 性 能 。 并 行 是 可 行 的 更 节能 的 方法 。 


Oo 每 个 周期 中 ， 信 号 从 0 变 到 1 或 者 从 1 变 到 0 时 ，a =1。 一 个 时 钟 周期 a =2。 一 些 参考 资料 中 使 用 活动 因子 
计算 完整 周期 数 而 不 是 变化 次 数 ， 此 时 ，a 取 上 面值 的 一 半 。 
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Gil 5-7 能 耗 计 算 
如 图 5-14 所 示 ， 计 算 x=4，Yy=12，z=24， 当 信号 w 经 历 一 个 完整 周期 从 0 到 1 再 到 0 时 
的 动态 能 耗 。 假 设 a 的 变化 一 直 传 导 到 e， 这 里 可 以 忽略 连 线 电容 ， 假 定 电源 电压 Vi =1 V。 
计算 每 级 的 电容 并 相 加 。 动 态 能 耗 是 已 =C 记 ， 因 为 了 =1， 则 已 =C。 首 先 计算 电 容 Cus 
然后 在 相 加 后 转化 成 法 拉 ( 见 表 5-9)。 这 样 总 电容 是 163 x C. = (163) (0.515 fF) =84 fF, 
a 循环 一 次 动态 能 耗 是 84 (J. 


表 5-9 例 5-7 的 功 耗 计算 





信 = 电容 (Cin) 信 = 电容 (Ci) 
a l dN 24 x 1. 87 =44. 9 
bN 4 e 96 
c 12:x 1.43 =17.2 总 计 163 





小 结 


本 章 学 习 了 估算 CMOS 逻辑 电路 延迟 和 功 耗 的 简单 方法 。 虽 然 不 能 代替 具体 的 电路 模拟 ， 
但 是 这 种 方法 可 以 估计 典型 CMOS 人 逻辑 电路 的 延迟 和 动态 能 耗 ， 准 确 率 为 20% 。 重 要 的 是 ， 这 
种 方法 可 以 对 不 同 电路 设计 进行 比较 ， 让 我 们 选择 出 正确 的 解决 方案 。 

通过 第 4 章 介绍 的 简单 MOSFET 开关 模型 ， 我 们 可 以 使 用 一 个 简单 的 RC 模型 估算 CMOS 
电路 的 门 延迟 。 延 迟 等 于 驱动 门 的 输出 电阻 乘 以 被 驱动 的 总 电容 。 如 果 直 接 驱 动 一 个 负载 ， 延 
迟 随 着 驱动 门扇 出 的 增加 而 线性 增加 ， 比 率 为 负载 电容 与 驱动 门 输入 电容 之 比 。 为 了 更 快 地 驱 
动 大 负载 ， 我 们 通过 采用 固定 倍数 (通常 为 4) 的 驱动 门 增加 各 级 驱动 门 的 大 小 ， 从 而 构建 出 
一 个 多 级 驱动 门 。 

当 保持 输出 电阻 不 变 ， 持 续 增 加 输入 电容 时 ，CMOS 门 的 复杂 性 提高 了 。 我 们 把 输入 电容 
的 增加 称 为 门 的 逻辑 功效 。 一 个 驱动 门 的 扇 出 〈 或 电 功 效 ) 和 被 驱动 门 的 逻辑 功效 的 乘积 是 
每 级 的 总 功效 。 每 级 的 延迟 和 总 功效 成 正比 。 当 每 级 的 总 功效 均衡 后 延迟 最 小 ， 每 级 的 最 优 总 
功效 接近 4。 

片上 连 线 的 电阻 和 电容 都 随 着 长 度 增加 而 线性 增加 。 连 线 延 迟 RC 随 着 连 线 长 度 增 加 而 平 
方 增加 。 为 了 使 延迟 随 着 长 度 线性 增加 ， 我 们 把 连 线 分 成 固定 长 度 的 片段 ， 并 用 一 个 中 继 器 驱 
动 每 个 段 。 

当 信 号 变化 时 ， 由 于 电容 充 放电 ，CMOS 芯片 产生 动态 功 耗 。 由 于 晶体 管 漏电 流 的 存在 ， 
会 产生 静态 功 耗 。 动 态 功 耗 和 门 的 开关 切换 相关 , E= CV'. 28 nm 工艺 中 ， 一 个 典型 的 反 相 器 
功 耗 大 约 是 0. 5 人 条。 动态 功 耗 是 P=0.5Efa， 频 率 为 /， 活 动因 子 为 a。 

静态 功 耗 的 产生 大 部 分 是 由 于 亚 阔 值 漏电 流 的 存在 。 亚 阔 值 漏电 流 会 随 着 阔 值 电压 的 变化 
而 指数 变化 。 羡 值 电压 每 降低 70 mV， 漏 电流 10 倍增 长 。 通 过 调整 器 件 的 阔 值 电压 ， 可 以 得 
到 我 们 需要 的 漏电 流 ， 但 这 是 以 性 能 为 代价 的 。 典 型 的 高 速 处 理 过 程 中 漏电 流 会 很 大 ， 占 总 功 
耗 的 30% 。 低 漏电 流 过 程 中 可 以 忽略 漏电 流 ， 但 是 门 的 处 理 速 度 会 很 慢 。 


文献 说 明 


Mead 和 Rem 最 先 在 参考 资料 [74] 中 描述 了 驱动 大 电容 负载 的 指数 曲线 。 关 于 CMOS #E 
迟 模型 的 更 多 内 容 详 见 参考 资料 [49 ] 。 这 两 个 参考 资料 都 使 用 Elmore 延迟 模型 计算 RC 延迟 
[40]. 

1991 4, Sutherland 和 Sproull 介绍 了 逻辑 功效 的 概念 [100], Sutherland, Sproull 和 Harris 
完成 了 一 部 详细 描述 这 个 概念 及 其 应 用 的 专著 [98] 。 
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在 漏电 功 耗 占 主要 地 位 之 前 ， 缩 放 比 例 遵循 Dennard 等 人 制定 的 规则 [36]. Dennard 认为 


功率 密度 不 会 随 着 门 长 度 变 小 而 增加 的 这 种 观点 不 再 正确 。 
习题 


5.1 


5.2 


5,3 


5.4 


5.5 


5.6 


5.7 


5.8 


5.9 
5.10 


5.11 
5. 12 
5.13 


上 升 和 下 降 时 间 ， 工 。 计 算 图 5-18a 所 示 门 的 最 大 和 最 小 上 升 / 下 降 时 间 。 假 设 同 一 时 间 只 有 一 个 
输入 变化 ， 门 驱动 输出 为 4C.,, ， 结 果 用 i, 表示。 
上 升 和 下 降 时 间 ， 卫 。 计 算 图 5-18b 所 示 门 的 最 大 和 最 小 上 升 / 下 降 时 间 。 假 设 同一 时 间 只 有 一 个 
输入 变化 ， 门 驱动 输出 为 4Cas ， 结 果 用 tin PEAR o 


























a) 


图 5-18 习题 5.1 ~ 习题 5.3 的 电路 


上 升 和 下 降 时 间 ， 焉 。 计 算 图 5-18e 所 示 门 的 最 大 和 最 小 上 升 / 下 降 时 间 。 假 设 同一 时 间 只 有 一 个 

输入 变化 ， 门 驱动 输出 为 4C,,, ， 结 果 用 lin AS o 

反 相 器 链 的 延迟 和 能 耗 ，1 。 最 小 (大 小 为 1) 反 相 器 ， 后 面 连接 一 系列 FO 反 相 器 最 终 驱动 大 小 

为 256 的 反 相 器 ， 计 算 其 延迟 和 能 耗 ， 结 果 用 4, 和 E. UI 

反 相 器 链 的 延迟 和 能 耗 ， 卫 。 最 小 (大 小 为 1) 反 相 器 ,后面 连接 一 系列 FO4 反 相 器 最 终 驱 动 大 小 

为 256 的 反 相 器 ,计算 其 延迟 和 能 耗 ， 结果 用 tin I E. FAB o 

反 相 器 链 的 延迟 和 能 耗 ， 亚 。 最 小 〈 大 小 为 1) 反 相 器 ， 后 面 连接 一 系列 FOS 反 相 器 最 终 驱动 大 小 

为 256 的 反 相 器 ， 计 算 其 延迟 和 能 耗 ， 结 果 用 如 和 天 ,表示 。 

反 相 器 链 的 延迟 和 能 耗 ，V 。 最 小 〈 大 小 为 1) 反 相 器 ， 后 面 连接 一 系列 F016 反 相 器 最 终 驱 动 大 

小 为 256 的 反 相 器 ， 计 算 其 延迟 和 能 耗 ， 结 果 用 如 和 E. KOON. 

设计 CMOS 门 的 大 小 ， 工 。 设 计 函 数 f=aA (bV (ecAd) ) 的 4 输入 静态 CMOS 门 电路 。 

(a) 画 出 这 个 门 电路 的 原理 图 符号 ， 要 求 输出 端 带 反 相 圈 。 

(b) 画 出 这 个 门 电路 的 晶体 管 原 理 图 ， 规 定 晶体 管 的 大 小 ， 使 其 上 升 和 下 降 延 迟 都 等 于 最 小 反 相 
器 的 上 升 /下 降 延 迟 。 

(e) 计算 这 个 门 电路 每 个 输入 的 逻辑 功效 。 

设计 CMOS 门 的 大 小 ， 卫 。 设计 函数 /= (a Ab) V (cAd) 的 门 电路 。 重 复习 题 5.8 的 步 又。 

设计 CMOS 门 的 大 小 ， 亚 。 对 图 5-19， 完 成 下 面 的 步骤 : 

(a) 画 出 正确 的 PFET 网 络 。 

(b) 规定 每 个 晶体 管 的 大 小 ， 使 其 与 最 小 反 相 器 具有 相同 的 上 升 和 
下 降 电阻 。 

(e) 计算 每 个 输入 的 逻辑 功效 。 

延迟 计算 ，] 。 计 算 如 图 5-20 所 示 电 路 的 延迟 ， 结 果 用 4, 表示 。 

延迟 计算 ， 正 。 计 算 如 图 5-21 所 示 电 路 的 延迟 ， 结 果 用 心 ,表示 。 

RHH, Mo HAWK 5-22 所 示 电 路 从 输入 a 和 pp 到 信号 dN 的 延 < 

R, 结果 用 i, 表示 。 图 5-19 习题 5. 10 的 电路 图 
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2 4 4 20 


图 5-20 习题 5. 11 YRS. 14 和 习题 5.22 的 电路 。 每 个 门 的 下 面 已 经 标 出 了 门 的 大 小 





图 5-21 习题 5.12、 习 题 5.15 和 习题 5.23 的 电 图 5-22 ”习题 5. 13 、 习 题 $. 16 和 习题 5. 22 的 电 


5. 20 


5.21 


5.22 


路 。 每 个 门 的 下 面 已 经 标 出 了 门 的 大 小 路 。 每 个 门 的 下 面 已 经 标 出 了 门 的 大 小 


延迟 优化 ， 工 。 重 新 设计 图 5-20 中 门 的 大 小 ， 使 得 延迟 最 小 。 不 能 改变 输入 或 输出 门 的 大 小 。 
延迟 优化 ， 开 。 重 新 设计 图 5-21 中 门 的 大 小 ， 使 得 延迟 最 小 。 不 能 改变 输入 或 输出 门 的 大 小 。 
延迟 优化 ， 亚 。 重 新 设计 图 5-22 中 门 的 大 小 ， 使 得 a 到 dN 的 延迟 最 小 。 不 能 改变 输入 或 输出 门 
的 大 小 。 

连 线 延迟 ， 工 。28 nm 工艺 中 ， 计 算 10 mm 连 线 的 延迟 。 连 线 被 分 成 20 Ez 0.5 mm 的 连 线 ， 由 20 
倍 于 最 小 反 相 器 驱动 每 一 段 。 

ERER, Mo 28 nm 工艺 中 ， 计 算 1 mm 连 线 的 延迟 。 连 线 被 分 成 5 Ez 200 pm 的 连 线 ， 由 10 (Ë 
于 最 小 反 相 器 驱动 每 一 段 。 

ERER, Mo 28 nm 工艺 中 ， 计 算 1mm 连 线 的 延迟 。 连 线 被 分 成 10 Ez 100 pm ER, hH 10 倍 
于 最 小 反 相 器 驱动 每 一 段 。 

连 线 延 迟 和 能 耗 ， 工 。 下 面 使 用 的 中 继 器 是 最 小 中 继 器 的 13.5 倍 。 

(a) 计算 传输 1 位 数据 通过 5 mm 连 线 的 最 小 时 间 。 使 用 此 电路 传输 1 位 的 总 能 耗 是 多 少 ? 

(b) 如 果 中 继 器 间 的 距离 是 原来 的 2 倍 ， 延 迟 和 能 耗 是 多 少 ? 

(e) 画 出 下 面 的 图 : 延迟 和 段 长 度 的 关系 图 、 能 耗 和 段 长 度 的 关系 图 以 及 能 耗 和 延迟 的 散 点 图 。 
连 线 延 迟 和 能 耗 ， 工 。 比 最 小 连 线 宽 的 中 间 连 线 电 阻 低 ， 电 容 高 。 例 如 ， 如 果 一 段 连 线 的 宽度 是 
最 小 连 线 的 3 倍 ， 那 么 其 电阻 是 最 小 连 线 的 1/3 ， 甚 电容 增 大 2 倍 。 计 算 最 优 的 中 继 器 大小、 间 趾 
和 这 种 类 型 连 线 的 最 小 延迟 。 

能 耗 计 算 ， 工 。 当 图 5-20 中 的 输入 aN 从 0 到 1 再 到 0 时 ， 计 算 其 能 耗 。 假 设 转换 传输 到 eN, 
Vo =1 V, 

能 耗 计 算 ， 开 。 当 图 5-21 中 的 输入 a 从 0 到 1 再 到 0 时 ， 计 算 其 能 耗 。 假 设 转换 传输 到 e， 但 是 没 
传输 到 3 输入 与 非 门 的 输出 ，Vpo =1.1 Vo 

能 耗 计 算 ， 亚 。 当 图 5-22 中 的 输入 a 从 0 到 1 再 到 0 时 ,计算 其 能 耗 。 假 设 on =0.9 V， 转 换 传 
输 到 dN， 但 是 p 始终 是 0。 你 可 以 忽略 7 倍 反 相 器 的 输出 负载 。 

功 耗 设计 。 如 何 设计 功 耗 不 同 的 移动 电话 无 线 芯片 和 高 利用 率 的 服务 器 处 理 器 ? 你 将 分 别 使 用 什 
么 机 制 来 降低 功 耗 ? 使 用 的 约束 有 什么 不 同 ? 
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组 合 逻辑 电路 能 实现 一 组 输入 集合 上 的 逻辑 函数 。 组 合 电路 用 于 控制 、 运 算 和 对 数据 的 操 
作 ， 它 是 数字 系统 的 核心 。 时 序 逻 辑 电路 〈 见 第 14 章 ) 使 用 组 合 电路 产生 下 一 个 状态 函数 。 

本 章 介绍 组 合 逻辑 电路 以 及 在 给 定 设计 规格 的 情况 下 描述 设计 电路 的 过 程 。 在 20 世纪 80 
年 代 中 期 前 的 一 段 时 间 ， 组 合 电路 的 手动 综合 是 数字 设计 的 主要 工作 。 然 而 现在 ， 设 计 者 用 硬 
件 描述 语言 〈 如 Verilog) 就 可 以 描述 逻辑 电路 设计 规格 ,然后 由 计算 机 辅助 设计 (CAD) 程序 
自动 执行 综合 。 

这 里 会 介绍 手动 综合 过 程 ， 因 为 每 个 数字 设计 者 都 应 该 理解 如 何 从 设计 规格 产生 逮 辑 电 
路 。 理 解 这 个 过 程 ， 可 以 让 设计 者 在 实践 中 更 好 地 使 用 CAD 工具 来 实现 功能 ， 而 手动 生成 逻 
辑 关键 部 分 的 情况 极 少 。 

6.1 B824 

如 图 6-1 R, MAARE BR A — Hii, RAS REE A 83% 
态 。 当 一 个 输入 状态 改变 时 ， 输 出 的 改变 需要 一 段 时 间 。 除 了 这 种 延迟 ， 输 出 不 反映 电路 的 历 
史 状 态 。 对 于 组 合 电路 ， 不 管 以 前 输入 状态 的 顺序 如 何 ， 给 定 输入 状态 就 会 产生 相同 的 输出 状 
态 。 输 出 依赖 上 一 个 输入 状态 的 电路 称 为 时 序 电 路 〈 见 第 14 章 ) 。 

例如 ， 一 个 择 多 电路 (majority circuit) PAn MHA, WRB | n/2 +1 | 个 输入 为 1， 则 
输出 为 1， 这 个 电路 是 一 个 组 合 电路 。 输 出 仅 由 当前 输入 状态 中 1 的 个 数 决定 ， 上 一 个 输入 状 
态 不 影响 输出 。 

另 一 方面 ， 如 果 交 个 输入 中 1 的 个 数 大 于 上 一 个 输入 状态 中 1 的 个 数 ， 输 出 为 1， 这 个 电 
路 就 是 时 序 电路 〈 不 是 组 合 电路 ) 。 举 例 来 说 ， 给 定 输入 状态 i; =011， 如 果 上 一 个 输入 状态 是 
i, =010， 结 果 是 。=1, 或 者 如 果 上 一 个 输入 状态 是 i, =111， 结 果 是 。=0。 这 样 ， 输 出 不 
仅 依赖 于 当前 输入 ， 还 依赖 于 过 去 的 输入 〈 在 本 例 中 是 过 去 最 近 的 一 次 输入 ) ， 那 么 这 个 电路 
是 时 序 电 路 。 





图 6-1 一 个 组 合 逻 辑 电路 ， 输 出 集合 1o ，…，on} 仅仅 依赖 于 输入 集合 fi, oe, il 的 
当前 状态 。a) 单元 CL 具有 nn 个 输入 和 m 个 输出 。b) 用 总 线 表 示 具 有 nn 个 输入 和 m 
个 输出 的 等 价 单元 


组 合 逻 辑 电路 具有 静态 属性 ， 使 得 设计 和 分 析 组 合 逻辑 电路 非常 容易 。 相 对 于 组 合 电路 ， 
将 要 看 到 的 时 序 电路 一 般 非 常 复 杂 。 实 际 上 ， 为 了 更 好 地 处 理 时 序 电 路 ， 我 们 通常 使 用 同步 时 
序 电 路 ， 它 使 用 组 合 逻辑 产生 下 一 个 状态 函数 ( 见 第 14 章 ) 。 

请 注意 输出 仅 依 赖 于 各 个 输入 的 逻辑 电路 称 为 组 合 (combinational) 电路 ， 而 不 是 组 合 
(combinatorial) 。 两 个 词 听 起 来 相似 ， 但 是 含义 却 不 同 。 单 词组 合 (combinatorial) 指 的 是 数学 
计算 ， 不 是 逻辑 电路 的 组 合 。 直 接 说 就 是 记 住 组 合 逻辑 电路 是 把 各 个 输入 结合 (combine) 产 
生 一 个 输出 的 电路 。 
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6.2 AG 


组 合 罗 辑 电路 的 一 个 重要 性 质 是 在 非 循环 结构 下 闭合 。 也 就 是 说 ， 如 果 把 许多 组 合 逻辑 电 
路 连接 在 一 起 一 一 一 个 组 合 逻 辑 电路 的 输出 连接 到 另 一 个 组 合 逻 辑 电路 的 输入 一 一 同时 避免 产 
生 任 何 环 路 〈 循 环 ) ， 得 到 的 电路 还 是 一 个 组 合 逻辑 电路 。 这 样 ， 把 小 的 组 合 迎 辑 电 路 相连 就 
形成 大 的 组 合 多 辑 电路 。 

图 6-2 给 出 了 非 循环 结构 和 循环 结构 的 例 
子 。 图 6-2a 中 两 个 组 合 电路 组 合 后 形成 一 个 新 
的 组 合 电路 ， 电 路 中 没有 循环 结构 ， 而 图 6-2b 
所 示 的 电路 不 是 组 合 电 路 ， 上 面 单元 的 输出 连 
接 到 下 面 单元 的 输入 ， 其 输出 又 连接 到 上 面 单 
元 的 输入 ， 形 成 了 循环 ， 反 馈 变 量 的 值 能 够 记 
忆 电 路 的 历史 状态 ， 因 此 ， 这 个 电路 的 输出 不 
仅仅 是 输入 的 函数 。 我 们 以 后 要 看 到 的 用 来 构 
建 大 多 时 序 逻 辑 电路 单元 的 触发 器 ， 正 是 使 用 











图 6-2 在 非 循环 结构 下 闭合 的 组 合 逻 辑 电路 。 
a) 由 2 个 组 合 逻 辑 电路 组 成 的 非 循 环 
电路 也 是 组 合 逻 辑 电 路 。b) 由 2 个 组 


了 图 6-2b 所 示 的 反馈 回路 。 合 逻 辑 电路 组 成 的 循环 电路 不 是 组 合 
合 电 路 的 非 循 环 结构 是 组 合 电路 。 一 个 组 合 电 内 部 状态 


路 单元 的 输入 仅 连 接 到 主要 输入 上 ( 即 不 是 连 

接 到 其 他 单元 的 输出 上 ) ,那么 这 个 单元 是 1 级 单元 。 类 伏地， 一 个 单元 的 输入 仅 连 接 到 主要 
输入 上 并 且 / 或 者 连接 到 1 级 单元 的 输出 上 ， 中 间 经 过 个 单元 ,那么 这 个 单元 是 +1 级 单 
元 。 根 据 定义 ， 所 有 1 级 单元 都 是 组 合 电路 。 然 后 ， 如 果 假 设 1 到 下 级 所 有 单元 都 是 组 合 电 
路 ， 则 +1 级 单元 也 是 组 合 电路 。 因 为 组 合 电路 的 输出 仅 依赖 于 输入 的 当前 状态 ， 所 有 输入 
仅 依赖 于 当前 主要 输入 的 状态 ， 其 输出 也 仅 依赖 于 主要 输入 的 当前 状态 。 


6.3 真 值 表 、 最 小 项 和 标准 形式 

假设 构建 一 个 组 合 逻辑 电路 ， 当 4 位 输入 表示 一 个 二 进 制 素数 时 ， 输 出 为 1。 为 了 表示 这 
个 电路 实现 的 逻辑 函数 ， 一 种 方法 是 用 语言 描述 一 一 正如 刚才 描述 的 一 样 。 但 是 ， 我 们 希望 更 
精确 地 定义 逻辑 函数 。 

通常 ， 我 们 从 真 值 表 开始 ， 真 值 表 显示 了 每 个 输入 组 合 对 应 的 输出 值 。 表 6-1 是 4 位 素数 
函数 的 真 值 表 。 对 于 一 个 nn 输入 函数 ， 真 值 表 有 2" 行 〈 本 例 中 是 16 行 ) ， 一 行 对 应 一 个 输入 
组 合 。 每 一 行列 出 了 对 应 输入 组 合 的 电路 的 输出 (对 于 只 有 1 位 的 输出 ， 那 么 就 是 0 或 1)。 





表 6-1 4 位 素数 或 1 电路 的 真 值 表 。 列 Out 是 对 应 16 个 输入 组 合 的 输出 











No. In Out No. In Out 
0 0000 0 8 1000 0 
l 0001 l 9 1001 0 
2 0010 1 10 1010 0 
3 0011 1 ll 1011 1 
4 0100 0 12 1100 0 
5 0101 1 13 1101 l 
6 0110 0 14 1110 0 
7 0111 ] 15 1111 0 








O thm, Hee “KARI” pw. AA AGE 1 PP. PRONE, (A 不 是 素数 [44 ] 。 我 们 会 在 习题 
中 (习题 6.5) 设计 一 个 不 包括 1 HRCA, 
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当然 ， 表 中 显示 了 输出 是 0 和 1 的 所 有 输入 组 合 ， 显 得 有 点 宛 余 。 只 显示 那些 输出 为 1 的 
输入 组 合 就 足够 了 。 这 样 素数 函数 的 简化 表 如 表 6-2 所 示 。 


表 6-2 4 位 素数 电路 的 简化 真 值 表 。 仅 列 出 输出 为 1 的 输入 








简化 表 (426-2) 提供 了 一 种 实现 素数 函数 逻辑 电路 的 方法 。 对 于 表 中 的 每 一 行 ， 输 入 变 
量 或 其 补 通过 与 门 连接 在 一 起 ， 只 有 输入 组 合 是 表 中 某 一 行 时 ， 对 应 的 与 门 输出 才 为 真 。 例 
wm, PAH, 我 们 可 以 使 用 一 个 与 门 实现 孔 数 / =dAcAbAa (d、c、b 和 a 是 In 的 4 
位 ) 。 如 果 对 表 中 的 每 一 行 重复 这 个 过 程 ， 可 以 得 到 完整 函数 : 

f=(dNeNbNKNaV(dNEANKANG)V(dANEAbAa)V(d Kc b Aa) 
V(dAcAbAa) V(dAcCcAbAa) V(dAcAbAa) (6-1) 

图 6-3 是 对 应 公式 (6-1) 的 逻辑 原理 图 。7 个 dcba 
与 门 对 应 公式 (6-1) 中 的 7 个 乘积 项 ， 也 对 应 表 6-2 
中 的 7 行 。 当 输入 与 真 值 表 中 某 行 的 输入 值 相等 
时 ,与 门 的 输出 为 1。 例 如 ， 当 输入 是 0101 (二 进 
制 的 5) HF, 标 有 5 的 与 门 输出 为 高 。 这 些 与 门 作 
为 7 输入 或 门 的 输入 ， 当 任何 一 个 与 门 输出 为 高 
时 ,或 门 输出 为 高 ， 即 如 果 输 入 是 1、2、3、5、7、 
11 或 13 时 ， 输 出 为 高 。 这 正 是 我 们 所 需要 的 函数 。 

公式 (6-1) 中 的 每 个 乘积 项 都 叫 作 最 小 项 。 
最 小 项 是 包括 电路 的 每 个 输入 或 者 输入 的 补 的 乘积 
项 。 公 式 (6-1) 中 的 每 一 项 都 包括 4 位 输入 (或 4 
位 输入 的 补 )， 因 此 ,它们 是 最 小 项 。 所 谓 最 小 ， 图 6-3 ”一 个 用 合 取 范式 (MSM) 形式 表 





就 是 指 4 输入 乘积 项 代表 输入 状态 数 最 小 (每 个 变 示 的 4 位 素数 电路 。 与 门生 成 最 小 
量 必须 而 且 只 能 以 变量 或 其 补 的 形式 出 现 一 次 )， 项 ， 最 小 项 与 真 值 表 中 输出 为 真 的 
或 指 真 值 表 中 行 数 最 小 。 在 6.4 节 中 我 们 将 会 写 出 行 对 应 ， 然 后 ， 这 些 最 小 项 都 作为 
能 够 代表 多 个 输入 状态 的 乘积 项 一 一 实际 上 是 已 经 或 门 的 输入 。 当 电路 的 输入 与 这 些 
合并 的 最 小 项 。 行 一 致 时 ， 输 出 为 真 
可 以 把 公式 (6-1) 简写 为 : 
f= >, m(1,2,3,5,7 11,13) (6-2) 


这 种 形式 表明 输出 是 括号 中 列 出 的 最 小 项 之 和 (“或 ”运算 )， 每 个 最 小 项 与 真 值 表 的 一 行 相 
对 应 ， 公 式 (6-2) 中 的 最 小 项 列表 是 真 值 表 中 使 函数 为 真 的 行 的 列表 。 

回忆 3.4 节 ， 用 最 小 项 之 和 表示 的 逻辑 函数 是 标准 形式 ， 对 于 每 个 逻辑 图 数 ， 标 准 形式 是 
唯一 的 。 虽 然 这 种 形式 是 唯一 的 ， 但 效率 并 不 高 。 通 过 合并 最 小 项 简化 成 乘积 项 更 好 ， 其 中 每 
个 乘积 项 代表 了 真 值 表 中 的 多 行 。 
例 6-1 RER 

画 出 一 个 4 位 “3 的 倍数 ”函数 的 简化 真 值 表 。 如 果 输 入 是 3 的 倍数 一 一 3、6、9、12 或 
15， 那 么 函数 输出 为 真 。 并 把 这 个 函数 表示 为 最 小 项 之 和 形式 。 
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表 6-3 3 的 倍数 函数 的 简化 真 值 表 











简化 真 值 表 如 表 6-3 所 示 。 它 简单 地 列 出 了 输出 为 真 的 输入 组 合 ， 最 小 项 之 和 形式 为 : 
f= 2 m(3,6,9,12,15) 


6.4 ”蕴涵 项 和 立方 体 


表 6-2 中 有 这 样 几 行 ， 它们 之 间 只 有 一 位 不 同 。 例 如 , 行 0010 和 0011， 只 有 最 右面 
的 位 (最低 有 效 位 ) 不 同 。- 这 样 ， 如 果 把 In 的 某 些 位 变 成 了 (0 或 1)， 就 可 以 通过 一 行 
001X 代替 两 行 0010 和 0011， 这 个 新 行 001X 对 应 一 个 乘积 项 ， 它 包括 4 位 输入 (或 者 是 它们 
的 补 ) 的 三 个 : 

fmr=dAMcAb=(dAcAbNa)V(aANcAbAa) (6-3) 
乘积 项 001X 把 对 应 0010 和 0011 的 两 个 最 小 项 包含 进来 。 只 有 当 它 们 之 一 为 真 时 ，001X 为 真 。 
这 样 ， 在 逻辑 函数 中 ， 就 可 以 用 更 简单 的 乘积 项 001X 代替 两 个 最 小 项 0010 和 0011, PH 
不 变 。 

1R 001X (dAcAb) 这 样 的 乘积 项 为 真 时 ， 函 数 为 真 。 这 样 的 乘积 项 称 为 函数 的 冀 涵 项 。 
另 一 种 说 法 是 乘积 项 瘟 涵 函数 。 一 个 最 小 项 可 能 是 也 可 能 不 是 函数 的 蕴涵 项 。 最 小 项 0010 ( d 
A 人 cAbAa) 是 素数 函数 的 蕴涵 项 ， 因 为 它 蕴涵 函数 一 一 当 0010 为 真 时 ， 函 数 为 真 。 注 意 0100 
(dAcA5bAa) 也 是 一 个 最 小 项 ( 它 是 包括 每 个 输入 或 其 补 的 乘积 项 ) ,但 它 不 是 素数 函数 的 蕴 
涵 项 。 当 0100 为 真 时 ， 素 数 函 数 为 假 ， 因 为 4 不 是 素数 。 如 果 一 个 乘积 项 是 函数 的 最 小 项 ， 
那么 它 既 是 最 小 项 又 是 函数 的 蕴涵 项 。 

在 一 个 立方 体 上 对 蕴涵 项 进行 可 视 化 非常 有 用 ， 
如 图 6-4 所 示 。 图 中 显示 了 在 一 个 三 维 立方 体 图 上 
表示 一 个 3 位 素数 函数 。 立 方 体 的 每 个 顶点 代表 一 
个 最 小 项 。 通 过 立方 体 可 以 很 容易 发 现 哪些 最 小 项 
和 蕴涵 项 能 够 合并 成 更 大 的 比 涵 项 ”只 有 一 个 变量 
不 同 的 最 小 项 彼此 相 邻 (如 001 和 011); 两 个 顶点 
之 间 的 边 (如 01X) 表示 包括 两 个 最 小 项 的 乘积 项 
(两 个 相 邻 最 小 项 进行 “或 ”运算 ) 。 只 有 一 个 变量 
不 同 的 边 (如 0Xl AN 1X1) 在 立方 体 上 相 邻 ; 面 由 
边 组 成 ， 其 乘积 项 蕴涵 了 两 个 边 的 乘积 项 (如 
XX1), RAP, 3 位 素数 函数 用 5 个 粗 体 顶 点 
(001, O10, 011，101 和 111) 表示 。 连 接 这 些 硕 点 图 6-4 3 位 素数 函数 的 可 视 化 立方 体 图 。 





的 5 条 粗 体 边 表示 函数 的 5 个 2 变量 蕴涵 项 (XOL, 每 个 顶点 都 对 应 一 个 最 小 项 ， 每 条 

0X1, 01X, X11 和 1X1)。 最 后 ， 阴 影 面 (XX1) 表 边 对 应 两 个 变量 ， 每 个 面 对 应 一 个 

示 图 数 的 一 个 1 变量 蕴涵 项 。 变量 。 粗 体 的 顶点 、 边 和 阴影 面 表 
4 位 素数 函数 的 立方 体 如 图 6-5 所 示 。 图 中 只 AS 3 位 素数 函数 的 蕴涵 项 





O ”如果 一 个 蕴涵 项 比 另 一 个 蕴涵 项 包含 更 多 的 最 小 项 ， 那 么 就 说 它 比 另 一 个 蕴涵 项 大 。 例 如 ， 区 涵 项 001 大 小 
为 1， 因 为 它 只 包含 了 1 个 最 小 项 ， 蕴 涵 项 01X 大 小 为 2， 因 为 它 包含 了 两 个 最 小 项 (010 和 011) ， 因 此 01X 
比 001 X. 
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标 出 了 函数 的 最 小 项 。 为 了 表示 4 个 变量 ， 这 里 绘制 了 两 个 三 维 立 方 体 代替 一 个 四 维 立 
方 体 ， 其 中 一 个 立方 体 在 另 一 个 立方 体 中 间 。 像 以 前 一 样 ， 顶 点 代表 最 小 项 ， 边 表示 合 
有 1 个 X 的 乘积 项 ， 面 表示 含有 两 个 X 的 乘积 项 。 在 四 维 图 中 ， 用 8 个 体积 表示 含有 3 4 X 
的 乘积 项 。 例如， 外 面 的 立方 体 表示 1XXX 一 一 所 有 最 小 项 最 左边 的 位 (最 高 有 效 位 ) d 为 
真 。4 位 素数 函数 有 7 个 顶点 (最 小 项 ) ， 连 接 相 邻 顶点 得 到 7 条 边 (4 —4 X ARD) , 
最 后 ， 连 接 相 邻 边 得 到 一 个 面 (有 两 个 天 的 董 涵 项 ) 。4 位 素数 函数 的 所 有 蕴涵 项 都 显示 在 
表 6-4 中 。 





表 6-4 4 位 素数 函数 的 所 有 蕴涵 项 ， 质 蕴涵 项 用 粗 体 表示 














变量 个 数 
4 3 2 1 
0001 001X 0XX1 
0010 00X1 
0011 0X01 
0101 0x11 
0111 01x1 
1011 X011 
图 6-5 4 位 素数 函数 的 可 视 化 立方 体 图 = = 


计算 机 程序 使 用 逻辑 函数 的 内 部 表示 法 即 一 组 蕴涵 项 进行 逻辑 函数 的 综合 和 优化 。 其 中 每 
个 蕴涵 项 都 是 由 含有 元 素 0、1 或 X 的 向 量 表示 。 为 了 化 简 函 数 ， 第 一 步 ， 产 生 函 数 的 所 有 蕴 
涵 项 ， 如 表 6-4 所 示 。 实 现 这 一 目标 的 步骤 过 程 可 以 从 操作 函数 的 所 有 最 小 项 开始 ( 表 6-4 中 
的 “4” 列 ) 。 对 于 该 列 中 的 每 个 最 小 项 ， 尝 试用 一 个 并 替换 每 个 变量 。 如 果 结 果 是 函数 的 草 
涵 项 ， 那 么 把 结果 填 人 含有 1 个 蕴涵 项 列表 中 ( 表 6-4 中 的 “3” 列 ) 。 然 后 对 于 每 个 含有 一 
个 的 蕴涵 项 ， 在 每 个 不 是 X 的 位 置 用 XX 替换， 如 果 结 果 是 蕴涵 项 ， 那 么 把 结果 填 和 含有 2 个 
X 的 蕴涵 项 列表 中 。 对 含有 2 个 X 的 蕴涵 项 重复 此 过 程 ， 并 继续 ， 直 到 不 再 产生 蕴涵 项 。 这 个 
过 程 是 根据 给 定 最 小 项 列表 得 到 蕴涵 项 列表 的 过 程 。 

如 果 蕴 涵 项 x 有 这 样 的 属性 ， 即 用 一 个 X 蔡 代 x 中 的 任意 为 0 或 1 的 位 ,结果 不 是 蕴涵 项 ， 
MPR x 是 质 冀 涵 项 。o 质 蕴涵 项 是 不 能 再 大 的 蕴涵 项 。 素 数 函 数 的 质 蕴涵 项 如 表 6-4 中 粗 体 
所 示 。- 

如 果 一 个 函数 的 质 蕴涵 项 x 是 唯一 包含 函数 的 一 个 特征 最 小 项 y 的 质 蕴涵 项 ， 则 称 * 是 必 
要 质 冀 涵 项 。x 是 必要 的 ， 因 为 没有 其 他 的 质 蕴 涵 项 包含 y。 没 有 x 的 质 蕴 涵 项 集合 不 包括 最 
小 项 y。4 位 素数 函数 的 4 个 质 蕴涵 项 都 是 必要 的 。 蕴 涵 项 0XX1 是 唯一 包括 0001 和 0111 的 质 
蕴涵 项 。 最 小 项 0010 只 包含 在 质 蕴涵 项 001X 中 ，X101 是 包含 1101 的 唯一 质 蕴 涵 项 ，X011 是 
包含 1011 的 唯一 质 蕴涵 项 。 


例 6-2 蕴涵 项 
写 出 下 面 通 数 的 所 有 冀 涵 项 并 指出 哪些 是 质 冀 涵 项 : 
f = Ym(0,1,4,5,7,10) 
+ 6-5 列 出 了 蕴涵 项 。 首 先 在 最 左 列 写 出 6 个 最 小 项 ， 它 们 也 是 草 涵 项 。 然 后 ， 改 变 每 个 
最 小 项 的 其 中 一 位 后 ， 判 断 它 是 否 与 其 他 蕴涵 项 的 最 小 项 相同 ， 如 果 相 同 ， 那 么 在 那个 位 置 用 





O 这 里 使 用 “ 质 ”与 质数 函数 无 关 。 
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全 蔡 换 并 填 入 表 中 的 下 一 列 。 例 如 ， 改 变 0000 的 最 低 有 效 位 得 到 0001，0001 也 是 一 个 蕴涵 项 ， 
所 以 ， 把 000X 填 入 3 变量 列 。 

重复 这 个 过 程 ， 改 变 每 个 3 变量 蕴涵 项 中 不 是 和 ” 表 6-5 例 6-2 函数 的 蕴涵 项 和 质 蕴涵 项 
的 位 ， 检 查 是 否 与 其 他 3 变量 蕴涵 项 相同 。 如 果 相 一 (cc we UO 








变量 个 数 
同 ， 把 履 盖 两 个 列 涵 项 的 2 变量 列 涵 项 填 入 下 一 列 。 4 3 2 1 
例如 ， 改 变 000X 的 第 二 位 得 到 010X， 它 是 一 个 瘟 涵 0000 Sane Bion 
项 ， 所 以 可 以 把 0X0X 填 入 2 变量 蕴涵 项 列表 中 。 它 0001 0X00 
是 此 函数 唯一 的 一 个 2 变量 蕴涵 项 。 0100 0x01 
函数 的 三 个 质 蕴涵 项 用 粗 体 表示 出 来 ，1010 是 0 Gn 


质 蕴涵 项 ， 因 为 改变 它 的 任何 位 后 都 不 是 一 个 蕴涵 ioo 

项 ， 这 样 1010 不 被 任何 3 变量 蕴涵 项 包含 。 同 样 ，01X1 

也 是 质 比 涵 项 ， 因 为 它 不 被 0X0X 包含 。 最 大 的 蕴涵 项 0XOX 是 质 蕴涵 项 ， 因为 使 它 变 大 后 得 
到 的 蕴涵 项 包含 的 最 小 项 不 是 函数 的 最 小 项 。 


6.5 FER 

绘制 立方 体 很 不 方便 (特别 是 四 维 或 更 多 维 的 立方 体 )， 所 以 我 们 常 使 用 把 立方 体 转化 成 
二 维 图 的 卡 诺 图 (或 简称 图)。 图 6-6a 是 4 变量 最 小 项 在 4 变量 K 图 中 的 排列 。K 图 中 的 每 
个 方 格 都 对 应 一 个 最 小 项 ， 并 用 最 小 项 表示 的 数 标 出 。 每 个 方向 有 2 个 变量 ， 并 使 用 格雷 码 顺 
序 排列 ， 所 以 在 同一 维度 ， 从 一 个 方 格 到 另 一 个 方 格 只 有 一 个 变量 改变 回 到 
开头 的 方 格 之 间 。 例 如 ， 在 图 6-6a 中 ,我 们 把 输入 deba 的 最 右面 两 位 ba 放 在 横 轴 上 。 沿 着 这 
条 轴 ， 两 位 (ba) 的 值 依次 为 00、01、11 和 10。 最 左面 两 位 de 按 相 同 的 方式 放 在 纵 轴 上 。 因 
为 从 列 到 列 ， 从 行 到 行 (包括 边缘 ) 只 有 一 个 变量 改变 ， 所 以 在 K 图 中 相 邻 的 两 个 最 小 项 只 
有 一 个 变量 不 同 ， 正 如 立方 体 中 相 邻 的 最 小 项 一 样 。 

图 6-6b 是 4 位 素数 函数 的 K 图 。 每 个 方 格 的 内 容 要 么 是 1， 要 么 是 0。1 表明 这 个 最 小 项 
是 函数 的 蕴涵 项 ,0 表明 这 个 最 小 项 不 是 函数 的 蕴涵 项 。 稍 后 ， 方 格 的 内 容 会 包含 X， 表 明 这 
个 最 小 项 可 以 是 一 个 列 涵 项 ， 也 可 以 不 是 一 个 草 涵 项 ， 即 我 们 不 关心 这 个 最 小 项 。 

图 6-6c 说 明了 图 中 的 相 邻 属性 ， 就 像 立方 体 中 的 相 邻 属性 ， 这 样 很 容易 找到 更 大 
的 蕴涵 项 。 此 图 是 在 K 图 上 标 出 了 素数 函数 的 质 蕴涵 项 。 三 个 大 小 为 2 (— X) 的 蕴涵 

是 图 中 一 对 相 邻 的 1。 例 如 ， 蕴 涵 项 X011 是 列 ab=11 中 把 顶端 方 格 和 底 端 方 格 (c=0) 
圈 起 来 的 一 对 儿 1。 大 小 为 4 的 蕴涵 项 包含 4 个 1， 可 能 是 一 个 大 方 格 ， 就 像 例 子 中 的 





ba a 





a) 


图 6-6 4 位 素数 函数 的 卡 诺 图 (K 图 )。 输 入 a 和 5b 沿 着 模 轴 改变 , 输入 c 和 4 沿 着 纵 轴 改 
变 。 卡 诺 图 这 样 排列 使 得 与 每 个 方 格 相 邻 (包括 边缘 相 邻 ) 的 所 有 方 格 只 有 一 个 变量 
不 同 。a) 4 变量 K 图 中 最 小 项 的 排列 ; b) 4 位 素数 函数 的 K E; e) 在 相同 K 图 中 
标 出 函数 的 4 个 质 蕴涵 项 。 注 意 ， 蕴 涵 项 X011 是 从 项 到 底 圈 起 来 
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0XX1 ， 也 可 能 是 一 整 行 或 一 整 列 ， 这 个 函数 中 没有 。 例 如 ， 乘 积 项 XX00 对 应 K 图 中 的 
最 左 列 。 

图 6-7 是 在 2 变量 、3 变量 、5 变量 K 图 中 最 小 项 的 排列 位 置 。5 变量 K 图 包括 两 个 并 排 在 
一 起 的 4 变量 KK 图。 两 个 K 图 中 相应 的 方 格 是 相连 的 ， 因 为 最 小 项 中 只 有 变量 。 的 值 不 同 。K 


图 的 变量 数 最 多 是 8， 可 以 由 4 x4 个 4 变量 K 图 组 成 。 
e=0 


a 





ba 





00 01 11 10 

















a) b) 


图 6-7 最 小 项 在 不 同 大 小 的 K 图 中 的 位 置 。a) 2 变量 K 图 ; b) 3 变量 K 图 ; c) 5 变量 K 图 


例 6-3 卡 诺 图 

画 出 例 6-2 中 函数 的 卡 诺 图 ， 并 圈 出 质 冀 涵 项 。 

这 个 函数 的 卡 诺 图 如 图 6-8 所 示 ， 图 上 标 有 兄 数 的 质 冀 涵 项 。 我们 把 是 函数 冀 涵 项 的 最 小 
项 的 方 格 标 上 1。 通过 合并 相 邻 的 1 # £ # ÀK 6523 2838 


c 





图 6-8 例 6-3 的 卡 诺 图 ， 此 函数 最 小 项 是 0、1、4、5、7 A110 


6.6 函数 的 覆盖 

一 旦 拥有 一 个 函数 的 列 涵 项 列表 ， 剩 下 的 问题 就 是 选择 能 履 盖 函数 的 成 本 最 低 的 荀 涵 项 集 
合 。 如 果 每 个 函数 的 最 小 项 都 包含 在 覆盖 中 的 至 少 一 个 蕴涵 项 中 ， 那 么 这 个 蕴涵 项 集合 就 是 函 
数 的 一 个 覆盖 。 我 们 定义 一 个 蕴涵 项 的 成 本 等 于 乘积 项 中 变量 的 个 数 。 这 样 ，4 变量 函数 ， 如 
最 小 项 0011 的 成 本 为 4, 含 一 个 X 的 蕴涵 项 (如 001X) 的 成 本 为 3， 含 两 个 X 的 蕴涵 项 (如 
0XX1) 的 成 本 为 2， 以 此 类 推 。 

选择 一 个 成 本 低 的 蕴涵 项 集合 的 过 程 如 下 : 

l) 以 一 个 空 覆盖 开始 ; 

2) 把 所 有 必要 质 列 涵 项 添加 到 覆盖 中 

3) 对 于 每 个 剩 下 的 未 覆盖 最 小 项 ， 把 包含 那个 最 小 项 的 最 大 蕴涵 项 添加 到 覆盖 中 。 

这 个 过 程 可 以 得 到 一 个 低 成 本 的 覆盖 ， 但 是 不 能 保证 得 到 成 本 最 低 的 覆盖 。 第 3 步 中 将 最 
小 项 添加 到 履 盖 中 可 选择 不 同 的 顺序 ， 而 且 禾 盖 每 个 最 小 项 时 ， 选 择 的 等 成 本 蕴涵 项 方法 不 
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一 ， 因 此 会 产生 不 同 的 覆盖 ， 从 而 造成 成 本 的 不 同 。 

对 于 4 位 素数 函数 ， 它 由 4 个 必要 质 蕴 涵 项 完全 覆盖 。 这 样 ， 在 第 2 步 后 开始 综合 ， 这 个 
履 盖 是 最 小 的 并 且 是 唯一 的 。 

考虑 图 6-9a 所 示 的 逻辑 函数 。 这 个 函数 没有 必要 质 列 涵 项 ， 所 以 从 一 个 空 覆盖 转 到 第 3 
步 。 在 第 3 步 中 ， 假 设 按照 数字 的 顺序 来 选择 未 被 覆盖 的 最 小 项 。 以 最 小 项 000 开始 ， 可 用 
X00 或 0X0 覆盖 000， 这 两 个 都 是 函数 的 蕴涵 项 。 如 果 我 们 选择 X00， 可 以 得 到 如 图 6-9b 所 示 
的 覆盖 。 如 果 选 择 0X0， 得 到 如 图 6-9c 所 示 的 覆盖 。 这 两 个 覆盖 即使 不 是 唯一 的 ,但 都 是 最 
小 的 。 

这 个 过 程 也 可 能 产生 非 最 小 覆盖 。 在 图 6-9 所 示 的 K 图 中 ,假设 最 初 选择 蕴涵 项 X00， 然 
后 选择 蕴涵 项 X11。 这 样 可 能 产生 最 小 覆盖 ， 因 为 它 是 一 个 覆盖 未 覆盖 最 小 项 的 最 大 蕴涵 项 
(大 小 为 2) 。 但 是 ， 如 果 选 择 这 样 做 ， 那 么 就 不 能 用 3 个 最 小 项 覆盖 函数 了 ,就 会 用 4 个 最 小 
项 完成 覆盖 。 实 际 中 ， 用 哪 一 种 方法 都 没有 关系 。 因 为 除了 特殊 情况 外 ,逻辑 门 成 本 很 低 ， 没 
有 人 关心 覆盖 是 否 最 小 。 


pa a 





图 6-9 具有 不 唯一 最 小 覆盖 并 且 没 有 必要 质 蕴涵 项 的 函数 。a) 函数 的 K 图 。b) 包含 X00、 
1X1 和 01X 的 一 个 覆盖 。e) UF 10X, X11 和 0X0 的 男 一 种 覆盖 


例 6-4 函数 的 覆盖 

求 下 面 3 变量 函数 的 最 小 履 盖 : 

f= Tm(1,3,4,5) 

卡 诺 图 如 图 6-10 所 示 , 3 个 2 变量 蕴涵 项 OX1. X01 和 10X, X 
A OX Fo 10X 是 必要 的 。 函 数 被 2 个 质 草 涵 项 完全 覆盖 。 因 此 可 以 
写 出 : 

f = 0X1 V 10X 

或 





f(c,b,a) = (€ Aa) V (c À b) 
图 6-10 用 于 找 出 例 6-4 
6.7 由 覆盖 转化 成 门 电路 HNI K 图 

—H#8#|— Tami 83k ae) AS ae, A Ee kp JH p, 8 w rh 89 eS 
蕴涵 项 都 使 用 与 门 ， 然 后 把 与 门 的 输出 连接 到 一 个 或 门 的 输入 端 。 这 样 ，4 位 素数 函数 的 与 - 
或 实现 如 图 6-11a 所 示 。 

CMOS 逻辑 电路 中 只 能 使 用 非 门 ， 所 以 对 于 与 、 或 函数 我 们 使 用 与 非 门 ， 如 图 6-11b Bras. 
因为 CMOS 门 电路 的 所 有 输入 具有 相同 极 性 (都 带 反 相 圈 或 都 不 带 反 相 圈 ) ， 所 以 在 需要 的 时 
候 ， 可 以 增加 反 相 器 使 输入 反 相 。 我 们 使 用 或 非 门 很 容易 设计 函数 ， 但 是 因为 相同 扇 人 〈 见 
5.3 节 ) 的 情况 下 , 与 非 门 逻辑 功效 小 ， 所 以 与 非 门 更 受 欢 迎 。 

CMOS 门 电路 也 受 限 于 它们 的 扁 和 人 (DL 5.3 节 )。 在 典型 的 单元 库 中 ， 一 个 与 非 门 或 一 个 
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或 非 门 的 最 大 扇 人 是 4。 如 果 需 要 更 大 的 扇 人 ， 那 么 就 要 使 用 门 的 树 〈 如 2 个 与 非 门 形成 1 个 
或 非 门 ) 来 构建 一 个 大 的 与 门 或 一 个 大 的 或 门 ， 必 要 时 添加 反 相 央 来 纠正 极 性 。 


s |o R. ja 





b) 

图 6-11 4 位 素数 函数 的 逻辑 电路 。a) 使 用 与 门 和 或 门 的 逻辑 电路 ， 在 输入 端 有 任意 个 反 相 圈 。 
每 个 与 门 对 应 一 个 函数 覆盖 中 的 质 北 涵 项 。b) 使 用 CMOS 与 非 门 和 反 相 器 的 逻辑 电 
路 。 与 非 门 可 以 用 于 “与 ”运算 和 “或 ”和 运算。 必要 时 ， 使 用 反 相 器 对 输入 求 补 


68 不 完全 确定 函数 


通常 ， 我 们 的 设计 规格 中 保证 不 会 用 到 某 组 输入 状态 (最 小 项 ) 集合 。 例如， 要 设计 一 
个 工 位 十 进 制 素数 检测 电路 。 此 电路 仅 接收 0 ~9 范围 内 的 输入 值 。 也 就 是 说 ， 对 于 一 个 在 0 ~ 
9 之 间 的 输入 ， 如 果 输 入 值 是 素数 ， 电 路 必须 输出 1， 否则 输出 0。 但 是 ， 对 于 10 ~ 15 之 间 的 
输入 ， 输 出 值 没有 被 指定 ， 可 以 是 0， 也 可 以 是 1。 

通过 利用 这 些 无 关 输 入 状态 ,我 们 可 以 简化 逻辑 函数 ， 如 图 6-12 所 示 。 图 6-12a 是 十 进 制 
素数 函数 的 K 图 。K 图 中 对 应 无 关 输 入 状态 的 方 格 中 写 入 闷 。 实 际 上 ， 我 们 把 输入 状态 分 成 3 
个 集合 : /一 一 那些 使 输出 为 1 的 输入 组 合 ; 及 一 一 那些 使 输出 为 0 的 输入 组 合 ; 有 一 一 那些 输 
出 不 确定 (可 以 是 0 也 可 以 是 1) 的 输入 组 合 。 在 这 个 例子 中 , A 是 用 1 标 出 的 5 个 最 小 项 
(1、2、3、5 和 7) 的 集合 , f, 包含 标 有 0 的 5 个 最 小 项 (0、4、6、8 和 9), f, ARR PR 
小 项 (10 ~15)。 

一 个 不 完全 确定 函数 的 一 个 蕴涵 项 是 这 样 的 一 个 乘积 项 ， 它 包含 至 少 一 个 fi 中 的 最 小 项 ， 
不 包含 hh 中 的 任何 最 小 项 。 这 样 ， 我 们 可 以 通过 包含 中 的 最 小 项 来 扩大 蕴涵 项 。 图 6-12b 是 
十 进 制 素数 函数 的 3 个 质 蕴 涵 项 。 注 意 最 初 的 素数 函数 的 蕴涵 项 001X 在 包含 了 i 中 的 两 个 最 
小 项 后 扩大 成 X01X。 增 加 了 两 个 新 的 质 蕴 涵 项 X1X1 和 XI11， 每 个 都 是 把 放 中 的 两 项 和 /中 
的 两 项 合并 产生 的 。 注 意 乘积 项 11XX 和 1X1X 都 在 fy 中 ， 即 使 它们 不 包含 hh 中 的 最 小 项 , 它 
们 也 不 是 蕴涵 项 。 因 为 蕴涵 项 必须 至 少 包含 一 个 中 的 最 小 项 。 

使 用 公式 (6-2) 的 表示 法 ， 可 以 写 出 带 无 关 项 的 函数 如 下 : 

f= Y m(1,2,3,5,7) + D(10,11,12,13,14,15) (6-4) 


这 就 是 5 个 最 小 项 加 上 6 个 无 关 项 之 和 的 函数 。 

使 用 6.6 节 中 描述 的 过 程 可 以 生成 带 无 关 项 的 函数 覆盖 。 在 图 6-12 所 示 的 示例 中 有 2 个 质 
ZAI: OXX1 和 XO1X, OXX1 是 唯一 包含 0001 的 质 蕴涵 项 ，X01X 是 唯一 包含 0010 的 质 蕴 涵 
项 。 这 两 个 必要 质 蕴涵 项 覆盖 了 f 中 的 所 有 (5 个 ) 最 小 项 ， 所 以 它们 是 函数 的 一 个 覆盖 。 
此 产生 的 CMOS 门 电路 如 图 6-12c Aras. 

例 6-5 不 完全 确定 函数 

已 知 输入 是 一 个 素数 ， 设 计 一 个 电路 ， 能 够 检测 4 位 输入 是 否 等 于 7。 

填写 如 图 6-13 所 示 的 卡 诺 图 ， 把 输入 分 成 h、f 和 及 。 输 入 组 合 为 7 的 方 格 标 上 1， 所 有 
非 素 数 的 输入 组 合 标 上 一 一 因为 这 些 组 合 不 会 出 现在 输入 端 ， 剩 下 的 输入 组 合 标 上 0。 用 一 
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b) c) 
图 6-12 设计 十 进 制 素数 电路 的 过 程 说 明了 在 K 图 中 无 关 项 的 使 用 。a) 十 进 制 素数 电路 的 开 

Ed. 输入 状态 10 ~15 用 工 标 出 ， 它 们 是 无 关 状 态 。b) 显示 质 蕴 涵 项 的 K 图 。 此 电 
路 有 4 个 质 蕴涵 项 : 0XX1 、X01X、XX11 和 XI1X1。 前 两 个 是 必要 质 蕴涵 项 ， 因 为 它 
们 是 唯一 分 别 覆盖 0001 和 0010 的 蕴涵 项 ， 后 面 两 个 (XX11 A X1X1) 不 是 必要 质 蕴 
涵 项 ， 实 际 上 也 不 需要 它们 。c) 一 个 来 源 于 图 的 CMOS 逻辑 电路 。 两 个 与 非 门 对 
应 两 个 必要 质 蕴涵 项 

个 2 输入 与 门 就 可 以 实现 这 个 电路 。 

feba) = b À e 


6.9 “和 之 积 ” 形 式 的 实现 

到 目前 为 止 , 我 们 只 关注 了 真 值 表 中 为 1 的 输入 状态 ， 产 生 了 积 之 和 形式 的 逻辑 电路 。 利 
用 对 偶 性 ,我 们 也 可 以 通过 关注 真 值 表 中 为 0 的 输入 状态 实现 和 之 积 形式 的 逻辑 电路 。 在 
CMOS 实现 方式 中 ,我 们 更 倾向 于 积 之 和 的 实现 方式 ， 因 为 在 扇 人 相同 的 情况 下 ， 与 非 门 的 逻 
辑 功 效 比 或 非 门 的 小 。 但 是 ， 有 些 函 数 和 之 积 的 实现 比 积 之 和 的 实现 成 本 低 。 通 常 产 生 两 种 形 
式 的 电路 ， 从 中 选择 较 好 的 一 种 。 

最 大 项 是 每 个 变量 或 其 补 之 和 (“或 ”运算 )。 真 值 表 或 K 图 中 的 每 一 个 0 都 与 一 个 最 大 
项 相对 应 。 例 如 ， 图 6-14 所 示 图 表示 的 逻辑 函数 有 两 个 最 大 项 : aVbVeVd 和 aVbVeVd。 
为 了 简化 ,我 们 用 OR (0000) 和 OR (0010) 表示 。 注 意 ， 最 大 项 与 K 图 中 输入 状态 的 补 对 
应 ， 所 以 最 大 项 0，OR (0000)， 对 应 图 中 为 0 的 方 格 15。 我 们 可 以 使 用 合并 相 邻 1 的 方法 
来 合并 相 邻 的 0， 所 以 OR (0000) 和 OR (0010) 可 以 合并 成 OR (00X0) =aVeVd, 





图 6-13 例 6-5 中 的 不 完全 确定 函数 图 6-14 一 个 函数 的 K 图 ， 这 个 函数 有 两 个 最 
的 卡 诺 图 和 和 窗 盖 大 项 OR (0000) 和 OR (0010), € 
们 可 以 合并 成 OR (00X0) 


除了 在 K 图 中 是 以 0 组 合 而 不 是 以 1 组 合 之 外 ， 和 之 积 电路 设计 的 过 程 与 积 之 和 电路 设计 
的 过 程 相 同 。 图 6-15 说 明了 有 具有 三 个 最 大 项 函数 的 和 之 积 电路 的 设计 过 程 。 图 6-15a 是 函数 的 
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K 图 。 图 6-15b 中 包括 了 两 个 质 和 (不 包括 1 就 不 能 变 大 的 或 项 ): OR (00X0) 和 OR 
(0X10)。 这 两 个 质 和 需要 覆盖 K 图 中 所 有 的 0。 最 后 ， 图 6-15e 是 实现 这 个 函数 的 和 之 积 形式 
的 逻辑 电路 。 这 个 电路 包括 两 个 或 门 ， 一 个 质 和 用 一 个 或 门 ， 所 有 或 门 的 输出 都 是 一 个 与 门 的 
输入 ， 所 以 当 任 一 或 门 的 输出 为 0 时 ， 函 数 输出 为 0。 


a 





OR(0X10) b 
a) b) 





图 6-15 “和 之 积 ” 形 式 函 数 的 综合 过 程 。a) 具有 三 个 最 大 项 的 函数 的 K 图 。b) 2 个 质 和 。 
e) “和 之 积 ” 形 式 的 逻辑 电路 

一 旦 掌握 了 积 之 和 形式 电路 的 设计 方法 ,那么 产生 和 之 积 形式 的 逻辑 电路 最 简单 的 方法 是 
GE ANH (通过 交换 有 h 和 /1， 保 持 f 不 变 得 到 的 函数 ) 找 出 积 之 和 形式 的 电路 ， 然 
后 ， 应 用 德 * 摩根 律 ， 把 所 有 与 门 变 成 或 门 并 对 电路 输入 求 补 ， 从 而 得 到 这 个 电路 输出 的 补 ， 
即 多 辑 函 数 和 之 积 形 式 的 逻辑 电路 。 

例如 ,思考 十 进 制 素数 函数 。 十 进 制 素数 函数 的 补 的 K 图 如 图 6-16a 所 示 。 在 图 6-16b 中 
标 出 了 这 个 函数 的 三 个 质 蕴涵 项 。 积 之 和 形式 的 逻辑 电路 如 图 6-16c 所 示 ， 它 实现 了 图 所 示 
的 十 进 制 素数 函数 的 补 。 这 个 电路 直接 由 三 个 质 蕴 涵 项 得 出 。 图 6-16d 是 和 之 积 形 式 的 逻辑 电 
路 ， 它 是 计算 十 进 制 素数 函数 (图 6-16a 和 图 6-16b 中 K 图 的 补 ) 的 电路 。 和 之 积 形 式 的 逻辑 
电路 是 通过 对 图 6-16e 所 示 电 路 的 输出 求 补 并 应 用 德 ， 摩根 律 把 与 门 (或 门 ) 转换 成 或 门 (与 
门 ) 得 到 的 。 


ba a 


c) 





a) b) d 
d) 
图 6-16 使 用 求 补 方法 实现 十 进 制 素数 函数 的 和 之 积 形式 的 电路 。a) 十 进 制 素数 函数 补 的 K 
图 (十 进 制 合 数 函 数 ) b) 此 函数 的 质 蕴 涵 项 (XX00、X1X0 和 1XXX)。c) 积 之 
和 形式 的 逻辑 电路 ， 它 计算 十 进 制 素数 函数 的 补 。d) 十 进 制 素数 函数 的 逻辑 电路 ， 
它 是 由 c) 使 用 德 ， 摩根 律 推导 出 来 的 


例 6-6 和 之 积 
把 3 输入 函数 /= Yom (1,7) 表示 成 最 小 的 和 之 积 表达 式 。 
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画 出 卡 诺 图 (图 6-17) ， 此 函数 补 的 草 涵 项 为 三 = ym (0, 1, 3, 4, S, 6), W 
f" = V Gb A ey V (b A e) 

然后 ， 运 用 公式 (3-9), Hl 
f=a N (V ey) A (b V e) c 






6.10 BR 

我 们 很 少 关心 组 合 电 路 中 一 个 输入 上 的 变化 是 否 会 产生 输出 
的 变化 。 在 大 多 数 情况 下 ， 这 不 是 一 个 问题 。 对 于 几乎 所 有 的 组 
合 电 路 ,我们 只 关心 给 定 输入 后 的 稳 态 输 i 
关心 输出 是 如 何 变 成 稳定 状态 的 。 但 是 在 某 些 组 合 电路 的 应 用 定 函数 的 一 个 和 之 积 
中 ， 如 产生 时 钟 或 作为 异步 电路 的 反馈 时 ， 一 个 输入 变化 最 多 形式 的 卡 诺 图 和 覆盖 
产生 一 个 输出 变化 是 至 关 重 要 的 。 

例如 ，2 输入 多 路 器 电路 如 图 6-18 所 示 。 电 路 的 功能 是 : 当 c=1 时 ,输出 /等 于 输入 a, 
当 c=0 时 ， 输 出 /等 于 输入 5。 这 个 电路 的 K 图 如 图 6-18a 所 示 。K 图 中 有 2 个 必要 质 草 涵 项 : 
1X1 (aAc) 和 01X (Ac) ， 它 们 一 起 覆盖 函数 。 实 现 此 函数 的 迎 辑 电路 如 图 6-18b 所 示 ， 电 
路 中 2 个 必要 质 蕴 涵 项 使 用 2 个 与 门 。 每 个 门 上 的 数字 表示 门 的 延迟 。 输 入 e 端的 反 相 器 延迟 
是 3 个 单位 时 间 ， 其 他 三 个 门 的 延迟 都 是 1 个 单位 时 间 。 

4a=b=1, MAL, 输入 c 从 1 变 到 0 时 , 图 6-18c 显示 了 这 个 逻辑 电路 的 瞬时 响应 。 
3 个 单位 时 间 后 ， 在 时 间 为 4 时， 反 相 器 的 输出 上 升 。 期 间 ， 在 时 间 为 2 时， 上面 与 门 的 输出 
d 下降 ， 引 起 输出 了 在 时 间 为 3 时 下 降 。 在 时 间 为 4 时 ， 信 号 N 上升 引起 信号 e LA, RA, 
引起 信号 了 在 时 间 为 6 时 上 升 。 这 样 , 输入 c 上 的 变化 首先 引起 输出 的 下 降 ， 然后 上 升 。 

在 输出 端 f 上 的 1-0-1 变化 称 为 静态 1 型 险象 。 通 常 我 们 希望 输出 保持 稳 态 1, 但 是 可 
能 会 产生 短暂 的 0 险象 。 类 似 地 ,一 个 输入 的 变化 引起 输出 经 历 了 0 -1 -0 的 变化 ， 称 为 静态 
0 型 险象 。 在 更 复杂 的 电路 中 ， 具 有 更 多 级 逻辑 ， 还 可 能 会 表现 出 动态 险象 。 动 态 1 型 险象 输 
出 经 历 0-1-0-1 的 状态 变化 ,从 0 变 到 1 经 历 了 三 次 变化 而 不 是 一 次 变化 。 类 似 地 ， 动 态 0 
型 险象 是 经 过 三 次 变化 1 -0-1-0, URA O0 结束 。 

直观 地 看 ， 图 6-18 中 会 发 生 静 态 1 型 险象 是 因为 随 着 输入 从 111 变化 为 011 ,在 与 蕴涵 项 
OLX 相关 的 门 打 开 之 前 ， 与 蕴涵 项 1X1 相关 的 门 就 关闭 了 。 
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图 6-18 具有 静态 1 型 险象 的 2 输入 多 路 器 电路 。a) 显示 两 个 必要 质 蕴 涵 项 的 函数 的 K 图 。 
b) 多 路 器 的 门 级 逻辑 电路 。 数 字 表 示 每 个 门 的 延迟 (时间 单 位 任意 )。c) 时 序 图 ， 
显示 了 当 a=b=1 时, 输入 c 的 下 降 引 起 逻辑 电路 b) 的 变化 情况 
我 们 可 以 通过 使 用 一 个 函数 自身 的 蕴涵 项 覆盖 这 个 变化 来 消除 险象 ， 如 图 6-19 所 示 。 第 
三 个 与 门 (图 6-19b 中 间 的 与 门 ) 对 应 蕴涵 项 X11， 当 其 他 两 个 门 打开 和 关闭 时 ， 输 出 始终 为 
高 。 通 常 ， 可 以 通过 增加 元 余 蕴 涵 项 覆盖 变化 的 方法 消除 任何 电路 的 险象 。 
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图 6-19 没有 险象 的 2 输入 多 路 器 电路 。a) 函数 的 KK 图 ， 标 出 了 3 he A, Zú 08 
X11 不 是 必要 质 草 涵 项 ， 但 却 覆 盖 了 从 111 到 011 的 变化 。b) 没有 险象 的 多 路 器 门 
级 逻辑 电路 


例 6-7 险象 

消除 图 6-20 所 示 电 路 的 险象 。 即 保留 电路 逻辑 功能 的 同时 ， 消 除 在 输入 变化 时 的 任何 
险象 。 

图 6-20 中 的 两 个 门 对 应 草 涵 项 X00 和 0X1。 画 出 这 个 电路 a 
(图 6-21) 的 KK 图 ， 我 们 可 以 看 出 : 需要 覆盖 从 000 到 001 的 变 2 f 
化 。 否 则 ， 由 于 相关 门 的 速度 不 同 ， 当 在 其 他 门 打 开 之 前 一 个 门 
关闭 的 转换 中 ， 输 出 会 瞬间 变 为 0。 增 加 强 涵 项 00X 一 一 已 经 用 虚 
线圈 出 ， 它 覆盖 了 这 种 转换 。 图 6-22 的 逻辑 电路 为 蕴涵 项 00X 添 图 6-20 例 6-7 中 要 消除 险 
加 了 一 个 门 ， 用 于 覆盖 这 个 转换 并 消除 险象 。 象 的 逻辑 电路 
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f 
c 
图 6-21 图 6-20 所 实现 的 函数 的 K 图 。 由 实 线圈 图 6-22 此 电路 和 图 6-20 所 示 的 电路 功 
出 的 强 涵 项 提供 了 一 个 覆盖 ， 当 b=c = 能 相同 ,但 是 没有 任何 险象 


0, a 在 0 和 1 之 间 变 换 时 , 会 产生 险 
Zo 我 们 可 以 通过 增加 虚线 圈 出 的 蕴涵 


小 结 


本 章 学 习 了 如 何 手动 进行 综合 ， 从 而 生成 组 合 罗 辑 电路 。 给 定 电路 的 描述 ， 可 以 生成 一 个 
门 级 实现 。 首 先 ， 写 出 电路 的 真 值 表 ， 精 确定 义 函 数 行为 。 根 据 真 值 表 画 出 卡 诺 图 ， 在 卡 诺 图 
上 标 出 函数 的 冀 涵 项 非常 容易 。 蕴 涵 项 是 乘积 项 的 集合 ， 它 包含 至 少 一 个 fi 中 的 最 小 项 并 且 不 
包含 hh 中 的 最 小 项 ， 它 可 以 包含 也 可 以 不 包含 fi 中 的 最 小 项 。 

标 出 壮 涵 项 后 ， 通 过 找到 一 个 蕴涵 项 的 最 小 集合 就 能 产生 函数 的 一 个 履 盖 ,这些 蕴涵 项 的 
最 小 集合 包含 fi 中 的 每 个 最 小 项 。 首 先 ， 我 们 标 出 质 冀 涵 项 和 必要 质 蕴涵 项 ， 质 蕴涵 项 是 那些 
不 被 更 大 蕴涵 项 包含 的 蕴涵 项 ， 必 要 质 强 涵 项 是 唯一 包含 f 中 的 某 个 最 小 项 的 质 列 涵 项 。 从 函 
数 必要 质 蕴涵 项 的 和 覆盖 开始 ， 然 后 增加 质 强 涵 项 ， 这 些 质 蕴涵 项 包括 fi 中 的 未 被 覆盖 的 最 小 
项 ， 直 到 覆盖 f 中 所 有 的 最 小 项 为 止 。 这 个 覆盖 不 是 唯一 的 ， 它 取决 于 添加 质 蕴 涵 项 到 覆盖 中 
的 顺序 ， 所 以 我 们 会 得 到 不 同 的 结果 。 

根据 覆盖 可 以 直接 画 出 函数 的 CMOS 逻辑 电路 。 履 盖 中 的 每 个 草 涵 项 都 用 一 个 与 非 门 表 
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示 ， 其 输出 连接 到 与 非 门 (执行 或 运算 功能 ) ， 必 要 时 在 输入 端 增加 反 相 器 。 

理解 这 个 过 程 对 人 工 导 辑 综合 很 有 用 ， 实 际 上 ， 你 永远 不 会 用 到 这 个 过 程 。 现 代 逻 辑 设计 
几乎 都 使 用 自动 逻辑 综合 就 可 以 实现 ， 自 动 逻 辑 综合 中 ， 一 个 CAD 程序 把 一 个 逻辑 函数 的 高 
级 描述 自动 生成 逻辑 电路 。 自 动 综合 程序 解放 了 逻辑 设计 者 ， 使 他 们 不 用 辛苦 地 制作 Bd, m 
是 能 更 高 效 地 工作 。 同 时 ,许多 自动 综合 程序 生成 的 逻辑 电路 比 一 般 设 计 者 手动 生成 的 逻辑 电 
路 好 。 综 合 程序 能 考虑 到 多 级 电路 ， 并 使 用 库 中 的 特殊 单元 实现 ， 在 多 种 组 合 电路 方案 中 选 出 
最 好 方案 。 最 好 让 CAD 程序 做 那些 它 擅长 的 工作 ， 即 找 出 最 优 的 CMOS 电路 实现 给 定 函 数 ， 
让 设计 者 做 人 类 擅长 的 工作 ， 即 为 系统 设计 出 更 高 级 更 智能 的 组 织 结构 。 


文献 说 明 


使 用 画图 技术 设计 逻辑 的 详细 内 容 可 以 在 论文 “ 卡 诺 图 的 来 源 ”[60] 中 获得 。 这 篇 论文 
基于 1952 4Ẹ Veitch 提出 的 技术 [105], Quine-McCluskey 算法 用 于 找到 最 小 映射 ， 详 细 内 容 参 
见 1956 年 McCluskey 的 论文 [71], 


习题 
6.1 组 合 电路 。 图 6-23 中 所 示 的 哪个 电路 是 组 合 电路 ? 图 中 每 个 方 格 本 身 是 一 个 组 合 电路 。 


a a 
Š o 

b 
ë € 


o 
a) b) 
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a 
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c 
c) d) 


图 6-23 习题 6. 1 的 电路 图 。 每 个 方 格 本 身 是 一 个 组 合 电路 


6.2 斐 波 那 契 电路 。 设 计 4 位 翡 波 那 契 电路 。 如 果 输 入 是 斐 波 那 契 数 ( 即 0、1、2、3、5、8 或 者 13 ) 。 
那么 电路 输出 1。 完 成 下 列 步骤 ， 
(a) 写 出 函数 真 值 表 。 
(b) 画 出 函数 卡 诺 图 。 
(c) 标 出 函数 的 质 草 涵 项 。 
(d) 标 出 必要 质 列 涵 项 〈 如 果 有 必要 质 蕴涵 项 ) 。 
(e) 找 出 函数 的 一 个 覆盖 。 
(f) 画 出 函数 的 CMOS 门 电路 。 

6.3 最 小 遥 辑 。 画 出 实现 函数 的 逻辑 电路 图 。 此 函数 实现 的 功能 如 下 : 当 输入 (deba) 是 3、4、5、7、 
9. 13, 14, 15 时 ， 函 数 输出 为 真 。 尽 量 使 用 最 少 的 门 输入 数量 。 这 里 提供 了 变量 和 变量 的 补 〈 即 
a Fila’), 

6.4 十 进 制 斐 波 那 契 电路 。 完 成 习题 6. 2 中 的 步骤 ， 但 是 实现 的 是 十 进 制 斐 波 那 契 电路 。 这 个 电路 仅 对 
0 ~9 范围 的 输入 产生 输出 ， 输 出 与 其 他 6 种 输入 状态 无 关 。 

6.5 质数 电路 。 设 计 一 个 电路 ， 如 果 4 位 输入 是 质数 ， 不 包括 1， 则 输出 为 真 ， 即 如 果 输 入 是 2、3、5、 
7. 11313, 那么 输出 为 真 。 完 成 习题 6. 2 中 的 步骤 。 
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6. 11 
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6. 13 
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6.15 


6.16 
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十 进 制 质 数 电路 。 设 计 一 个 电路 ， 如 果 4 位 十 进 制 输入 是 质数 ， 不 包括 1， 即 如 果 输 入 是 2、3、5、 
7 时 ， 输 出 为 真 。 输 入 组 合 为 10 ~15 时 ,输出 为 X (无 关 项 )。 完 成 习题 6.2 PHAR, 
3 的 倍数 电路 。 设 计 一 个 4 输入 3 的 倍数 电路 。 如 果 电 路 的 输入 是 3、6、9、12、15， 那 么 输出 
为 真 。 
组 合 电 路 设计 。 设 计 一 个 最 小 的 CMOS HR, SCH pRB f= 2Zm(3,4,5,7,9,13 ,14,15) 。 
5 输入 质数 电路 。 设 计 5 输入 质数 电路 。 如 果 输 入 在 0 ~31 之 间 并 且 是 质数 (不 包括 1) ， 那 么 输出 
为 真 。 

6 输入 质数 电路 。 设 计 6 输入 质数 电路 。 这 个 电路 不 仅 能 识别 0 ~31 之 间 的 质数 ， 也 能 识别 32 ~ 
63 之 间 的 质数 。 

不 唯一 覆盖 。 设 计 一 个 4 HA. MAW f= Zm(0,1,2,9,10,11) 。 

和 之 积 ， 工 。 使 用 和 之 积 形式 设计 习题 6.4 中 的 十 进 制 斐 波 那 契 电路 。 

和 之 积 ， 开 。 使 用 和 之 积 形式 设计 习题 6. 6 中 的 十 进 制 质数 电路 。 

七 段 译 码 器 ， 工 。 习 题 6. 14 ~ 习题 6. 41 中 关于 七 段 译 码 器 的 描述 一 样 ， 此 组 合 电路 具有 4 位 输入 
a 和 一 个 7 位 输出 q. q 的 每 一 位 与 七 段 显 示 的 一 段 相 对 应 ， 显 示 方 式 如 下 : 

6666 


1 5 
"1 s 
0000 
2 4 
2 4 


3333 


4 的 第 0 位 〈 最 低 有 效 位 ) 控制 中 间 段 ， 第 1 位 控制 上 半 部 分 左边 的 段 ， 以 此 类 推 , 第 6 位 (最 
高 有 效 位 ) 控制 顶端 的 段 。 关 于 七 段 译 码 器 更 详细 的 描述 在 7.3 节 。 一 个 完全 译 码 器 可 以 译 码 16 
种 输入 组 合 。 输 入 组 合 为 10 ~ 15 时 表示 字母 A ~F (大 写字 母 A、C、E、F 和 小 写字 母 b、d) 。 一 
个 十 进 制 译 码 器 只 对 组 合 0 ~9 译 码 ， 不 关心 其 余 状态 。 

为 完全 七 段 译 码 器 的 0 段 设计 一 个 积 之 和 电路 。 

七 段 译 码 器 ，[ 。 为 完全 七 段 译 码 器 的 1 段 设计 一 个 积 之 和 电路 。 完 全 七 段 译 码 器 的 描述 见习 
题 6.14。 

七 段 译 码 器 ， 焉 。 为 完全 七 段 译 码 器 的 2 段 设计 一 个 积 之 和 电路 。 完 全 七 段 译 码 器 的 描述 见习 
题 6. 14, 

七 段 译 码 器 ，]V。 为 完全 七 段 译 码 器 的 3 段 设计 一 个 积 之 和 电路 。 完 全 七 段 译 码 器 的 描述 见习 
I 6.14, 

七 段 译 码 器 ，V 。 为 完全 七 段 译 码 器 的 4 段 设 计 一 个 积 之 和 电路 。 完 全 七 段 译 码 器 的 描述 见习 
题 6. 14。 

七 段 译 码 器 ，VW[。 为 完全 七 段 译 码 器 的 5 段 设计 一 个 积 之 和 电路 。 完 全 七 段 译 码 器 的 描述 见习 
题 6. 14。 

七 段 译 码 器 ， 碍 。 为 完全 七 段 译 码 器 的 6 段 设计 一 个 积 之 和 电路 。 完 全 七 段 译 码 器 的 描述 见习 
题 6. 14。 

十 进 制 七 段 译 码 器 ， 了 。 为 十 进 制 七 段 译 码 器 的 0 段 设计 一 个 积 之 和 电路 。 十 进 制 七 段 译 码 器 的 
描述 见习 题 6. 14。 

十 进 制 七 段 译 码 器 ， 卫 。 为 十 进 制 七 段 译 码 器 的 1 段 设计 一 个 积 之 和 电路 。 十 进 制 七 段 译 码 器 的 
描述 见习 题 6. 14。 

十 进 制 七 段 译 码 器 ， 焉 。 为 十 进 制 七 段 译 码 器 的 2 段 设计 一 个 积 之 和 电路 。 十 进 制 七 段 译 码 器 的 
描述 见习 题 6. 14。 

十 进 制 七 段 译 码 器 ，IV 。 为 十 进 制 七 段 译 码 器 的 3 段 设计 一 个 积 之 和 电路 。 十 进 制 七 段 译 码 器 的 
描述 见习 题 6. 14。 


BOF MABHKIt 87 





6. 25 


6. 26 





十 进 制 七 段 译 码 器 ，V 。 为 十 进 制 七 段 译 码 器 的 4 段 设计 一 个 积 之 和 电路 。 十 进 制 七 段 译 码 器 的 
描述 见习 题 6. 14。 

十 进 制 七 段 译 码 器 ，VI。 为 十 进 制 七 段 译 码 器 的 5 段 设 计 一 个 积 之 和 电路 。 十 进 制 七 段 译 码 器 的 
描述 见习 题 6. 14。 

十 进 制 七 段 译 码 器 ，WL。 为 十 进 制 七 段 译 码 器 的 6 段 设 计 一 个 积 之 和 电路 。 十 进 制 七 段 译 码 器 的 
描述 见习 题 6. 14。 

和 之 积 形式 的 七 段 译 码 器 ， 工 。 为 完全 七 段 译 码 器 的 0 段 设计 一 个 和 之 积 电 路 。 完 全 七 段 译 码 器 
的 描述 见习 题 6. 14。 

和 之 积 形式 的 七 段 译 码 器 ， 。 为 完全 七 段 译 码 器 的 1 段 设计 一 个 和 之 积 电 路 。 完 全 七 段 译 码 器 
的 描述 见习 题 6. 14。 

和 之 积 形式 的 七 段 译 码 器 ， 亚 。 为 完全 七 段 译 码 器 的 2 段 设计 一 个 和 之 积 电 路 。 完 全 七 段 译 码 器 
的 描述 见习 题 6. 14, 

和 之 积 形式 的 七 段 译 码 器 ，V 。 为 完全 七 段 译 码 器 的 3 段 设 计 一 个 和 之 积 电路 。 完 全 七 段 译 码 器 
的 描述 见习 题 6. 14, 

和 之 积 形式 的 七 段 译 码 器 ，V 。 为 完全 七 段 译 码 器 的 4 段 设计 一 个 和 之 积 电路 。 完 全 七 段 译 码 器 
的 描述 见习 题 6. 14。 

和 之 积 形式 的 七 段 译 码 器 ，VL。 为 完全 七 段 译 码 器 的 5 段 设计 一 个 和 之 积 电 路 。 完 全 七 段 译 码 器 
的 描述 见习 题 6. 14。 

和 之 积 形 式 的 七 段 译 码 器 ， 旭 。 为 完全 七 段 译 码 器 的 6 段 设计 一 个 和 之 积 电 路 。 完 全 七 段 译 码 器 
的 描述 见习 题 6. 14, 

和 之 积 形式 的 十 进 制 七 段 译 码 器 ，IT 。 为 十 进 制 七 段 译 码 器 的 0 段 设 计 一 个 和 之 积 电路 。 十 进 制 
七 段 译 码 器 的 描述 见习 题 6. 14。 

和 之 积 形式 的 十 进 制 七 段 译 码 器 ， 开 。 为 十 进 制 七 段 译 码 器 的 1 段 设 计 一 个 和 之 积 电路 。 十 进 制 
七 段 译 码 器 的 描述 见习 题 6. 14 。 

和 之 积 形式 的 十 进 制 七 段 译 码 器 ， 亚 。 为 十 进 制 七 段 译 码 器 的 2 段 设 计 一 个 和 之 积 电路 。 十 进 制 
七 段 译 码 器 的 描述 见习 题 6. 14。 

和 之 积 形式 的 十 进 制 七 段 译 码 器 ，IV 。 为 十 进 制 七 段 译 码 器 的 3 段 设计 一 个 和 之 积 电路 。 十 进 制 
七 段 译 码 器 的 描述 见习 题 6. 14。 

和 之 积 形 式 的 十 进 制 七 段 译 码 器 ，V 。 为 十 进 制 七 段 译 码 器 的 4 段 设计 一 个 和 之 积 电 路 。 十 进 制 
七 段 译 码 器 的 描述 见习 题 6. 14。 

和 之 积 形式 的 十 进 制 七 段 译 码 器 ，VL。 为 十 进 制 七 段 译 码 器 的 5 段 设 计 一 个 和 之 积 电路 。 十 进 制 
七 段 译 码 右 的 描述 见习 题 6. 14。 

和 之 积 形式 的 十 进 制 七 段 译 码 器 ， 刀 。 为 十 进 制 七 段 译 码 器 的 6 段 设计 一 个 和 之 积 电 路 。 十 进 制 
七 段 译 码 器 的 描述 见习 题 6. 14。 

多 输出 电路 ， 工 。 设 计 一 个 积 之 和 电路 ， 使 其 输出 十 进 制 七 段 译 码 器 的 0、1、2 段 。 必 要 时 ， 输 
出 之 间 可 以 共享 逻辑 门 。 十 进 制 七 段 译 码 器 的 描述 见习 题 6. 14。 

多 输出 电路 ， 工 。 设 计 一 个 积 之 和 电路 ， 使 其 输出 十 进 制 七 段 译 码 器 的 3、4、5、6 段 。 必 要 时 ， 
输出 之 间 可 以 共享 逻辑 门 。 十 进 制 七 段 译 码 器 的 描述 见习 题 6. 14。 

MR, Io TAP 6-24a 中 存在 的 险象 。 

MR, H. THRE 6-24b 中 存在 的 险象 。 

加 法 器 卡 诺 图 ， 工 。 半 加 器 电路 输入 为 1 位 二 进 制 数 a Alb, 输出 和 s， 进 位 co, co Mls 连 起 来 
co, s 是 a 加 5 得 到 的 两 位 数值 结果 (例如 ， 如 果 a=1 IFA b=1, MJs=0, co=1), KF MA 
的 详细 描述 见 第 10 章 。 

(a) 写 出 半 加 器 的 输出 * 和 co 的 真 值 表 。 

(b) 画 出 半 加 器 的 输出 s 和 co 的 卡 诺 图 。 

(c) 圈 出 半 加 器 的 输出 和 co 的 质 蕴 涵 项 ， 并 写 出 s 和 co 的 逻辑 等 式 。 
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图 6-24 习题 6.44 和 习题 6. 45 的 电路 


6.47 ”加 法 器 卡 诺 图 ， 开 。 全 加 器 电路 输入 为 1 位 二 进 制 数 a、b 和 ci (进位 ), 输出 s 和 co。co Als 相连 
(co, s) 是 一 个 2 位 数值 ， 它 是 a、b、ci 相 加 的 结果 。( 例 如， 如果 a=1,， b=03fB ci=1, HM 
么 s=0，co =1)。 全 加 器 的 详细 描述 见 第 10 章 。 
(a) 写 出 全 加 器 的 输出 s 和 co 的 真 值 表 。 
(b) 画 出 全 加 器 的 输出 s 和 co 的 卡 诺 图 。 
(c) 圈 出 全 加 器 的 输出 * 和 co 的 质 荀 涵 项 ， 并 写 出 s 和 co 的 逻辑 等 式 。 
(d) 半 加 器 和 全 加 器 中 使 用 异 或 门 有 什么 好 处 ? 
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在 第 6 章 中 我 们 已 经 学 习 了 从 设计 规格 到 手工 综合 组 合 逻 辑 电路 的 方法 。3.6 节 中 讨论 过 
使 用 Verilog 描述 布尔 表达 式 ， 在 此 基础 上 ， 本 章 我 们 学 习 如 何 使 用 硬件 描述 语言 Verilog 描述 
组 合 电 路 。 用 Verilog 描述 后 的 函数 能 够 自动 综合 ， 不 需要 人 工 综合 。 

因为 所 有 优化 工作 由 综合 器 完成 ， 编 写 可 以 自动 综合 的 Verilog 的 主要 目的 是 使 程序 具有 
可 读 性 和 可 维护 性 ， 所 以 Verilog 描述 与 函数 模块 类 似 ( 例 如 ,使 用 case 或 者 casex 语句 描 
述 真 值 表 ) ， 比 那些 类 似 于 实现 的 语句 更 好 (例如 ,使 用 assign 语句 的 等 式 或 者 是 使 用 门 的 
结构 描述 ) 。 与 那些 人 工 实 现 函 数 相 比 ， 使 用 Verilog 描述 函数 更 易于 阅读 和 维护 。 

为 了 证 明 Verilog 模块 的 正确 性 ， 我 们 可 以 编写 测试 平台 (testbench ) 。 测 试 平台 是 一 段 
Verilog 代码 ， 可 以 在 仿真 时 将 待 测 模块 实例 化 。 测 试 平台 产生 激励 输入 ， 验 证 模块 输出 结果 是 
否 正确 。 编 写 Verilog 模块 时 必须 使 用 Verilog 的 可 综合 子 集 ， 但 测试 平台 不 能 被 综合 ， 所 以 可 
以 使 用 所 有 Verilog 语言 ， 包 括 loop 结构 。 在 典型 的 现代 数字 设计 项 目 中 ,与 设计 本 身 相 比 ， 
我 们 应 该 多 进行 设计 验证 (编写 测试 平台 ) 。 


7.1 用 Verilog 描述 素数 电路 


用 Verilog 描述 组 合 逻 辑 时 ， 我 们 应 该 使 用 那些 容易 被 综合 成 逻辑 电路 的 语言 结构 。 特 别 
指出 ， 在 描述 组 合 电路 时 ， 我 们 只 用 assign, case, casex 语句 或 者 其 他 组 合 模块 的 结构 
WARS 

本 节 中 ， 我 们 将 使 用 第 6 章 介绍 过 的 组 合 Verilog 讨论 素数 (包括 1) 电路 的 4 种 实现 
方法 。 


7.1.1 Verilog 模块 


在 深入 研究 4 种 素数 模块 实现 之 前 ， 让 我 们 回顾 一 下 Verilog 模块 的 结构 。 模 块 是 具有 
输入 和 输出 端口 的 逻辑 块 。 模 块 中 的 逻辑 通过 输入 〈 对 组 合 模块 而 言 是 当前 输入 状态 ) ir 
算 输出 。 声 明 模 块 以 后 ， 可 以 实例 化 模块 的 一 个 或 多 个 副本 ， 也 能 够 在 高 层 模块 中 进行 实 
例 化 。 

Verilog 模块 的 基本 结构 如 图 7-1 所 示 。 模 块 运用 Verilog 中 的 case 语句 实现 了 4 位 素数 函 
数 ， 如 图 7-2 所 示 。 所 有 模块 都 以 关键 字 module 开始 ， 以 关键 字 endmodule 结束 。 从 关键 
F module 到 第 一 个 分 号 是 模块 声明 ， 它 包括 模块 名 称 (如 图 7-2 中 的 prime), 后 面 插 号 中 
是 端口 名 称 列表 。 例 如 ， 模 块 prime 的 端口 名 称 是 in 和 isprime。 

模块 声明 后 面 是 输入 和 输出 声明 ， 这 些 语 句 都 是 使 用 关键 字 input 或 者 output 开始 ， 
接着 是 指定 宽度 设计 规格 (可 选 )， 最 后 是 具有 方向 和 宽度 的 端口 列表 。 例 如 ，input[3:0] 
in; 声 明 端 口 in 是 4 位 宽 的 输入 ， 最 高 有 效 位 是 in [3 ]。 注 意 我 们 也 可 以 声明 为 input[0: 
3 ]in; , in 的 最 高 有 效 位 是 in [0]. 





O ”描述 组 合 模块 时 可 能 会 用 到 if 语句 ， 这 时 ， 如 果 不 写 el se 语句 或 者 忘记 为 if 语句 的 每 个 分 支 中 的 每 个 输 
出 变量 赋值 就 很 容易 产生 时 序 电路 ， 所 以 ， 我 们 不 建议 使 用 if 语句 。 
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module <module Name>(<port names>) ; 


<port declarations> ; 
<internal signal, wire and reg, declarations> ; 
<module body> ; 


endmodule 


图 7-1 使 用 Verilog 中 的 module 声明 了 一 个 具有 输入 和 输出 的 模块 ， 它 包括 模块 声明 、 输 
入 和 输出 信号 声明 、 内 部 信号 声明 和 一 个 实现 逻辑 功能 的 模块 体 





in 一 一 4 位 二 进 制 数 
isprime 一 一 如 果 in 为 素数 1，2，3，5，7，11 或 13， 则 为 真 


module prime(in, isprime) ; 
input [3:0] in ; // 4 位 输入 
output isprime ; // 如 果 输 入 为 素数 ， 则 为 真 


reg isprime ; 


always @(in) begin 


case (in) 
1,2, 3 5, 1 11,135; ISprimé = ibis 
default: isprime = 1’b0 ; 
endcase 
end 


endmodule 
图 7-2 使 用 case 语句 对 真 值 表 直 接 编码 ， 实 现 了 用 Verilog 描述 4 位 素数 或 1 函数 


接 下 来 是 内 部 信号 声明 ， 即 对 模块 内 部 将 要 被 赋值 的 信号 进行 声明 。 注 意 ， 这 里 可 能 包括 
输出 信号 。 如 果 一 个 信和 号 用 于 模块 间 的 连接 或 者 使 用 assign 语句 赋值 ， 那 么 声明 为 wire 类 
型 (如 图 7-3 和 图 7-8 所 示 )。 如 果 一 个 信号 是 在 case 或 casex 语句 中 被 赋值 ， 那 么 把 它 声 
AAA reg 类 型 ， 如 图 7-2 中 的 isPrime。 大 家 别 被 字面 意思 迷惑 ， 把 信号 声明 为 reg 类 型 不 
是 产生 一 个 寄存 器 。 我 们 仍然 在 构建 一 个 组 合 逻 辑 。 如 果 信 和 号 宽度 比 1 位 大 ， 那 么 声明 中 可 以 
写 出 宽度 。 因 为 输出 信号 类 型 默认 时 自动 声明 为 wire 类 型 ， 所 以 如 果 需 要 reg 类 型 输出 信 
号 ， 那么 就 必须 明确 地 把 输出 信号 声明 为 reg 类 型 。 

模块 体 中 的 语句 实现 了 计算 模块 输出 的 逻辑 。 这 里 会 用 到 Verilog 语言 的 子 集 ， 模 块 体 包 
含 一 个 或 多 个 模块 实例 ，assign 语句 、case 语句 和 casex 语句 。 在 素数 电路 的 4 种 实现 中 
(7.1.2 ~7.1.5 47) 使 用 到 了 这 些 语句 。 


7.1.2 case 语句 


如 图 7-2 ras, Verilog 的 case 语句 可 以 直接 列举 逻辑 函数 的 真 值 表 。case 语句 可 以 列 
举 每 个 输入 组 合 的 逻辑 函数 输出 值 。 在 这 个 例子 中 ， 为 了 节省 空间 ， 我 们 列 出 了 输出 为 1 的 输 





. 和 人 状态， 输出 为 0 为 默认 值 。 


注意 case 语句 必须 包含 在 always @ 单元 中 。 这 个 语法 说 明 在 @ 后 面 指 定 的 参数 状态 每 
次 发 生变 化 时 ， 这 个 单元 就 被 执行 。 在 这 种 情况 下 ，4 位 输入 变量 in 的 状态 每 次 发 生变 化 时 ， 
这 个 单元 都 执行 。 因 为 在 always @ 单元 中 ，isprime 被 赋值 ， 所 以 在 模块 中 ， 输 出 变量 
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isprime 声明 为 reg 类 型 。 这 里 没有 与 这 个 变量 相关 联 的 寄存 器 ， 电 路 是 组 合 电路 。 

在 用 always @ 单元 描述 组 合 电 路 时 ，@ 后 面 的 参数 列表 中 包含 所 有 输入 。 如 果 省 略 了 一 
个 输入 ， 那 么 当 这 个 输入 状态 发 生变 化 时 ， 这 个 单元 就 不 会 执行 ， 这 样 就 是 时 序 逻 辑 而 不 是 组 
合 逻 辑 了 。 列 表 中 省 略 信 号 也 会 造成 很 难 调试 的 奇怪 现象 。 在 Verilog 的 新 版 本 (2001 年 之 后 ) 
中 ,使 用 always@(* ) 这 样 的 语法 就 避免 了 这 种 现象 这样， 任何 变量 状态 发 生变 化 时 ， 单 
元 都 会 被 执行 。 整 本 书 中 我 们 都 使 用 这 种 方法 。 

使 用 Synopsys Design Compiler® 对 图 7-2 所 示 的 Verilog 进行 综合 ， 结 果 如 图 7-3 所 示 ， 这 个 
编译 器 使 用 了 典型 的 CMOS 标准 单元 库 。 综 合 器 把 图 7-2 中 的 Verilog 行为 描述 转换 为 Verilog 
结构 描述 ，Verilog 行为 描述 定义 要 做 的 事情 (如 真 值 表 ) ，Verilog 结构 描述 定义 如 何 去 完 成 
(如 5 个 门 和 它们 之 间 的 连接 ) Verilog 结构 描述 实例 化 5 个 门 : 2 个 或 -与 - 非 门 (OAL), 2 
个 非 门 GNV), 1 个 异 或 门 (XOR ) 。 连 接 门 的 4 个 线 变量 声明 为 nl 到 n4。 在 Design Compil- 
er 中 ,通过 声明 为 门类 型 (如 oAI13) 可 以 将 门 实例 化 ， 给 出 实例 名 (如 UL) ， 然 后 定义 哪 
个 信号 和 门 的 哪个 输入 、 输 出 相连 (如 Al (n2) 表示 信号 n2 和 输入 Al 相连 ) 。 


module prime ( in, isprime ); 


input [3:0] in; 

output isprime; 
wire nl, n2, n3, n4; 
OAI13 Ul ( .Al(n2), .Bl(n1), .B2(in[2]), .B3(in[3]), .Y(isprime) Y; 
INV U2 ( .A(in[1]), .¥(n1) ); 

INV U3 ( .A(in[3]), .Y¥(n3) ); 

XOR2 U4 ( .A(in[2]), .B(in[1]), .Y(n4) ); 

OAI12 US ( .Al(in[{0]), .Bl(n3), .B2(n4), .Y(n2) ); 


endmodule 





图 7-3 使 用 Synopsys Design Compiler® 对 图 7-2 所 示 的 Verilog 进行 综合 的 结果 ， 这 个 编译 器 使 
用 了 典型 的 标准 单元 库 。 综 合 后 的 原理 图 如 图 7-4 所 示 
请 注意 ， 实 例 化 一 个 门 可 以 采用 显 式 的 方式 将 信号 与 对 应 的 输入 和 输出 相连 ， 也 可 按照 模 
块 定义 时 端口 的 位 置 来 实例 化 。 例 如 ， 如 果 要 声明 的 端口 按照 顺序 列 出 ， 我 们 可 以 使 用 下 面 简 
单 的 语法 实例 化 XOR 门 : 


XOR2 U4 (in[2], in[1], m4) ; 


两 种 形式 等 价 。 对 于 复杂 的 模块 ， 显 式 连接 语法 避免 了 顺序 错误 〈 当 隐 含 的 顺序 变化 时 ， 避 免 
了 错误 的 发 生 ) 。 对 于 简单 的 模块 ， 位 置 定义 这 种 语法 更 简洁 也 更 具有 可 读 性 。 

图 7-4 是 综合 后 的 原理 图 ， 它 显示 了 综合 器 如 何 优化 逻辑 。 与 第 6 章 使 用 的 两 级 综合 方法 
不 同 ， 这 里 的 综合 器 使 用 4 级 逻辑 〈 不 包括 反 相 器 ) ， 包 括 异 或 门 ， 多 个 与 门 和 或 门 ， 但 是 这 
个 电路 仍 实现 了 相同 的 4 个 质 草 涵 项 (OXX1, 001X, X101 和 X001) 。 如 图 所 示 ， 门 U1 的 下 面 
部 分 直接 实现 了 蕴涵 项 001X。 门 U5 实现 了 其 他 3 个 蕴涵 项 一 一 把 in [0] 从 蕴涵 项 中 提取 出 
来 后 ,“ 与 ” 门 就 可 以 被 3 个 蕴涵 项 共享 。“ 或 ” 门 的 上 面 一 个 输入 U5 (n3) 与 in [0] 相 
“与 ”得 到 0XX1。 异 或 门 的 输出 是 乘积 项 X01X 和 X10X， 当 这 两 个 乘积 项 在 U5 与 in [0] 相 
“与 ”后 得 到 剩 下 的 两 个 蕴涵 项 X101 和 X011。 

这 个 综合 的 例子 说 明了 现代 计算 机 辅助 设计 工具 的 强大 。 一 个 熟练 的 设计 者 要 设计 出 这 样 
简洁 的 电路 要 付出 很 大 的 心血 ， 此 外 ， 综 合 工具 〈 通 过 约束 文件 ) 再 优化 时 侧重 于 提高 电路 
的 速度 ， 而 不 是 尽量 去 减 小 面积 。 使 用 现代 综合 工具 ， 逮 辑 设计 者 的 主要 任务 发 生 了 变化 ， 从 
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isprime 


图 7-4 图 7-3 的 原理 图 
优化 转变 成 设计 规格 ， 但 是 这 种 设计 规格 工作 会 随 着 系统 变 大 而 变 得 更 加 复杂 。 
例 7-1 使 用 case 语句 实现 温度 计 编 码 检测 器 


module therm_case(in, out) ; 


编写 一 个 模块 ， 功 能 是 检测 一 个 4 位 输入 是 否 input [3:0] in; 
是 合法 的 温度 计 编 码 信 号 (0000, 0001, 0011, output out; 
0111, 1111), BRA case 语句 实现 逻辑 。 reg out; 


模块 实现 如 图 7-5 所 示 。 首 先 声明 输入 (in) 
和 输出 (out). case 语句 里 有 两 行 : 一 个 输出 为 aawe (in) 
1 的 最 小 项 列表 和 一 个 输出 为 0 的 default 语句 。 0, 1, 3, 7, 15: out = 1'bi; 


always @(*) begin 


default: out = 1’b0; 
T. 1. 3 casex 语句 endcase 


另外 一 种 实现 素数 函数 的 方法 是 使 用 Verilog | 2 
中 的 casex 语句 列 出 覆盖 函数 的 4 个 质 蕴涵 项 ， 
如 图 7-6 所 示 。 除 了 使 用 casex 语句 替代 了 case 图 7-5 使 用 case 语句 实现 温度 计 编码 检 
语句 ， 这 种 实现 方法 与 图 7-2 所 示 的 实现 方法 相 测 器 的 Verilog 程序 
同 。casex 语句 允许 无 关 项 (多 个 X) 出 现 。 这 样 我 们 就 可 以 把 蕴涵 项 而 不 仅仅 是 最 小 项 放 
在 case 中 每 个 语句 的 左边 。 例 如 ，case 中 的 第 一 条 语句 4 'b0xx1 对 应 蕴涵 项 OXX1, A 
了 最 小 项 1、3、5 和 7。 





module primel(in, isprime) ; 
input [3:0] in ; // 4 位 输入 
output isprime ; // 如 果 输 入 为 素数 ， 则 为 真 


reg isprime ; 


always @(*) begin 
casex (in) 
4'b0xx1: isprime 
4’b001x: isprime 
4’bx011: isprime 
4'bx101: isprime 


default: isprime 


endcase 
end 
endmodule 





图 7-6 使 用 casex 语句 实现 4 位 素数 函数 的 Verilog FEF, casex 语句 能 够 描述 一 个 覆盖 的 所 有 列 涵 项 
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当 描 述 组 合 模块 中 的 一 个 输入 覆盖 其 他 输入 时 ，casex 语句 非常 有 用 。 例 如 ， 不 管 其 他 
输入 为 何 值 ， 一 个 使 能 输入 可 以 使 所 有 输出 变 为 低 ， 
或 者 是 一 个 优先 编码 器 (参见 8.5 4) ! 这 两 种 情况 module therm_casex(in, out) F 


input [3:0] in; 


下 casex 语句 就 非常 有 用 。 但 是 ， 对 于 素数 函数 ， 








图 7-2 的 实现 方法 较 好 ， 因 为 它 清晰 地 描述 了 被 实现 | 2 ON 
函数 而 且 便 于 维护 。 我 们 没 必 要 手动 减少 函数 蕴涵 
项 ,综合 工具 会 完成 这 项 工作 。 always @(*) begin 
例 7-2 ”使 用 casex 语句 实现 温度 计 编码 检测 器 kuya aie 
编写 一 个 模块 ， 要 求 使 用 casex 语句 实现 检测 siete an au 
一 个 4 位 输入 是 否 是 合法 的 温度 计 编 码 信号 。 4'bx111: out 
这 是 综合 器 适用 于 逻辑 化 简 的 一 种 情形 ， 温 度 default: out 
计 编 码 函 数 可 以 写成 下 面 的 形式 ; endcase 
fm s yä s = (a, A a, Aa,) V (a, Aa, end 
A a, A ay) V (a, A a, A ay) endmodule 
使 用 casex 语句 实现 这 个 函数 ， 如 图 7-7 所 示 。 图 7-7 使 用 casex 语句 实现 温度 计 编 码 检 


7.1.4 assign 语句 ee gi 

图 7-8 是 使 用 Verilog 描述 素数 电路 的 第 三 种 方法 。 这 种 方法 使 用 assign 语句 运用 等 式 来 
描述 逻辑 函数 。 描 述 中 没有 出 现 assiogon， 这 是 因为 assign 语句 与 声明 isprime BJ wire iË 
名 合并 了 ,2 wire isprime =… 语 句 等 价 于 : 

wire isprime ; 

assign isprime = ... 


与 使 用 casex 相 比 ， 使 用 等 式 描述 素数 电路 没有 什么 优势 。 使 用 真 值 表 描 述 更 便于 书写 ， 
更 具有 可 读 性 和 可 维护 性 。 综 合 器 会 把 真 值 表 精简 成 一 个 等 式 并 且 优 化 门 的 集合 。 


module prime2(in, isprime) ; 
input [3:0] in ; // 4 位 输入 
output isprime ; // 如 果 输 入 为 素数 ， 则 为 真 


wire isprime = (in[0] ~in[3]) | 
(in[1] & ~in[2] & ~in[3]) | 
(in [0] “in[1] & in[2]) | 
(in[ol & in[1] & ~in[2]) ; 


endmodule 





图 7-8 (EH assign 语句 描述 4 位 素数 函数 ， 此 情形 中 assign 已 经 和 wire 合并 


例 7-3 使 用 assign 语句 实现 温度 计 编 码 检测 器 
编写 一 个 模块 ， 要 求 使 用 assign 语句 实现 检测 一 个 4 位 输入 是 否 是 合法 的 温度 计 编 码 


改写 例 7-2， 化 简 的 逻辑 函数 如 下 : 


© 因为 isprime 被 声明 为 一 个 输出 ， 默 认为 wire 型 。 我 们 也 可 以 使 用 assign isprime =… 而 不 声明 为 
wire 类 型 。 


[134] 
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Cas |, Ga xG, sto) = (a, A a, A a, ) V (a, A a, A a, A a) V (a, A a, A a) 
直接 把 这 个 等 式 写 成 assign 语句 ， 如 图 7-9 所 示 。 


module therm_assign(in, out) ; 


input [3:0] in; 
output out; 


assign out = (“in[3] & ~in[2] & ~in[1]) | 
(“in[3] & ~in[2] & in[1] & in[0]) | 
(in[2] & in[1] & in[0]); 





endmodule 


图 7-9 使 用 assign 语句 实现 温度 计 编 码 检测 器 的 Verilog 程序 


7.1.5 结构 描述 


素数 函数 的 第 四 种 也 是 最 后 一 种 描述 方法 如 图 7-10 所 示 ， 它 是 一 个 结构 描述 ， 类 似 于 
综合 器 的 输出 ， 通 过 实例 化 5 个 门 ， 使 用 门 连接 的 方法 来 描述 函数 ， 与 综合 器 输出 (图 7-3) 
不 同 的 是 ， 这 种 描述 没有 实例 化 如 oAI13 的 模块 ， 它 使 用 了 Verilog 内 置 的 and 和 or 门 

module prime3(in, isprime) ; 
input [3:0] in ; // 4 位 输入 
output isprime ; // 如 果 输 入 为 素数 ， 则 为 真 


wire al, a2, a3, a4; 


andi1(al,in[0],~in[3]) ; 

and2(a2,in[1]),~in[2],~in[3]) ; 
and3(a3,in[0],~in[1],in[2]) ; 
and4(a4,in[0],in[1],~in[2]) ; 


orl(isprime,al,a2,a3,a4) ; 





endmodule 
图 7-10 Verilog 中 使 用 具体 的 门 描述 4 位 素数 函数 ， 程 序 中 列 出 了 与 门 和 或 门 的 输出 


与 前 两 种 描述 方法 一 样 ， 素 数 电 路 的 结构 描述 都 是 为 了 说 明 Verilog 语言 的 使 用 范围 。 
素数 函数 的 结构 描述 并 不 是 最 好 的 方法 。 如 上 所 述 , 设计 者 应 该 使 用 综合 器 进行 综合 和 
优化 。 

例 7-4 温度 计 编码 检测 器 的 结构 描述 

编写 一 个 结构 化 的 Verilog 模块 ， 检 测 4 位 输入 是 否 是 合法 的 温度 计 编 码 信号 。 

改写 例 7-2， 化 简 的 逻辑 函数 如 下 : 
f(s aa 54; Ap) = (a, A a, A a,) V (a, A a, A a, A a) V (a, A a, A äg) 

£ Verilog 程序 中 直接 实例 化 AND fe OR 11, 4e AND 门 的 输出 直接 赋 给 中 间 线 变量 (t2, 
t1, t0), OR 门 的 输出 赋 给 模块 的 输出 (out), 得 到 图 7-11。 





© Verilog 还 包括 nand, nor, xor 和 xnor 内 置 门 。 
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module therm_struct (in, out) ; 


input [3:0] in; 
output out; 
wire E2, El, E07 


andi (t0, ~in[3], ~in[2], ~in[1]); 
and2(t1, “~in[3], ~in[{2], iaf], in[0]); 
and3 (t2, in[2], in[1], in[0]); 

OFT (out, £2, £2, EO); 


endmodule 





图 7-11 温度 计 编码 检测 器 的 结构 化 Verilog 程序 


7.1.6 十 进 制 素 数 函 数 


图 7-12 说 明了 如 何 使 用 Verilog 列举 逻辑 函数 的 无 关 输 入 状态 。 这 里 我 们 再 次 使 用 Verilog 
的 casex 语句 列举 带 有 无 关 项 的 真 值 表 。 在 这 个 例子 中 ,我 们 使 用 默认 项 default 定义 输入 
状态 为 10 ~15 时 输出 为 无 关 状 态 (isprime =1'bx)。 因 为 只 有 一 个 默认 语句 ， 所 以 使 用 它 


指定 无 关 项 。 我 们 还 必须 明确 写 出 输出 为 0 的 5 种 输入 状态 。 


使 用 Synopsys Design Compiler® 对 图 7-12 所 示 的 Verilog 描述 进行 综合 的 结果 如 图 7-13 所 
示 ， 综 合 后 的 原理 图 如 图 7-14 所 示 。 完 全 指定 电路 具有 1 个 4 输入 门 、1 个 3 输入 门 、1 个 
XOR 门 和 2 个 反 相 器 ， 指 定 无 关 项 后 ， 逻 辑 简化 成 只 有 1 个 2 输入 门 、1 个 3 输入 门 和 1 个 反 


HA it o 


module prime _dec(in, isprime) ; 
input [3:0] in ; // 4 位 输入 
output isprime ; // 如 果 输 入 为 素数 ， 则 为 真 


reg isprime ; 


always @(*) begin 
case (in) 


0,4,6,8,9: isprime 


1,2,3,5,7: isprime 


default: isprime = 
endcase 


end 





endmodule 


图 7-12 使 用 case 语句 实现 4 位 十 进 制 素数 函数 ， 默 认输 出 为 无 关 项 


7.2 素数 电路 的 测试 平台 


通过 仿真 测试 模块 的 Verilog 描述 是 否 正确 ， 可 以 通过 编写 Verilog 测试 平台 验证 模块 。 测 
试 平台 本 身 就 是 一 个 Verilog 模块 ， 但 它 不 被 综合 成 硬件 并 且 只 用 于 帮助 测试 模块 。 测 试 时 ， 
测试 平台 模块 实例 化 模块 ， 产 生 输 入 信号 并 执行 模块 ， 检 验 模块 输出 信号 是 否 正确 。 测 试 平 台 


与 你 在 实验 室 平台 使 用 的 仪器 类 似 ， 都 是 产生 输入 信和 号， 观察 电路 的 输出 信号 。 
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module prime_dec ( in, isprime ); 


input [3:0] in; 
output isprime; 
wire m3, n4; 
NOR2 U3 ( .A(in[3]), .B(n3), .¥(isprime) ); 
AOI12 U4 ( .Al(in{0]), -Bl(in[1]), .B2(n4), .¥(n3) ); 
INV US ( .A(in[{2]), .¥(n4) ); 
endmodule 


图 7-13 使 用 Synopsys Design Compiler Xf K 7-12 所 示 的 Verilog 进行 综合 的 结果 。 进 行 综合 
后 的 原理 图 如 图 7-14 所 示 。 这 个 电路 比 图 7-4 所 示 的 完全 指定 电路 简单 得 多 
图 7-15 是 素数 电路 的 一 个 简单 测试 平台 。 测 
试 平台 本 身 是 一 个 Verilog 模块 ,但 是 没有 输入 和 
输出 。 在 测试 时 ,使 用 局 部 变量 作为 模块 的 输入 
和 输出 ， 本 例 中 使 用 的 变量 是 prime。 测 试 平台 
声明 了 素数 模块 的 输入 in 为 reg 类 型 变量 ， 这 
样 就 能 在 initial 单元 内 为 in 赋值 。 测 试 平台 
实例 化 模块 brime ， 把 输入 和 输出 联系 起 来 。 图 7-14 图 7-13 的 原理 图 








module test prime ; 


// 声明 局 部 变量 
reg [3:0] in ; 


wire isprime ; 


// 测试 下 的 实例 化 模块 


prime pO(in, isprime) ; 


initial begin 


// 使 用 输入 的 16 种 组 合 来 建 模 
in = O ; // 设置 输入 初始 值 
repeat (16) begin // 循环 16 次 
#100 // 延迟 100 个 时 间 单 位 
Sdisplay("in = %2d isprime = %1b",in,isprime) ; 


in+1 ; // 输入 加 1 


endmodule 





图 7-15 素数 模块 的 Verilog 测试 平台 


实际 上 ， 测试 平 台 真 正 的 测试 代码 包含 在 initial 单元 中 。initial 单元 和 always @ 
单元 类 似 ， 不同 之 处 在 于 ，always @ 是 在 每 次 信号 变化 时 执行 ， 而 initial 单元 是 在 仿真 
开始 时 只 执行 一 次 。initial 单元 设置 in =0， 然 后 进入 循环 。repeat (16) 语句 表示 执行 
循环 体 16 次 。 每 次 执行 循环 体 时 ,仿真 器 使 用 机 00 语句 等 待 100 个 时 间 单 元 ,设置 模块 的 输 
出 ,显示 输入 输出 ， 然 后 输入 变量 加 1， 进 入 下 次 循环 。16 次 循环 以 后 ,循环 和 仿真 结束 。 

测试 平台 不 描述 设计 ， 它 仅仅 是 输入 激励 信和 号 或 者 测试 模式 ， 并 输出 结果 。 综 合 化 设计 中 不 
允许 有 结构 体 ， 因 为 测试 平台 模块 可 以 不 被 综合 ， 所 以 可 以 使 用 Verilog 结构 体 。 例 如 ， 图 7-15 
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中 的 initial, repeat 和 相 00 语句 在 综合 Verilog 模块 中 是 不 允许 的 ， 但 是 这 些 语句 在 测试 


平台 中 是 很 有 用 处 的 当 编写 Verilog 程序 时 ， 我 们 要 知道 
编写 的 是 可 综合 程序 还 是 测试 平台 ， 两 个 编写 风格 有 很 大 
不 同 。 

素数 模块 (图 7-2) 和 测试 平台 (图 7-15) 的 Verilog fJ 
真 输出 如 图 7-16 所 示 。 每 次 执行 循环 体 ， 测 试 平 台中 的 
$ display 语句 都 产生 一 行 输出 。 通 过 检查 输出 ， 我 们 看 
到 素数 模块 执行 正确 。 

对 于 小 模块 ， 我 们 手工 检验 Verilog 模块 输出 是 否 正确 ， 
只 需要 检查 一 次 。 但 是 ， 对 于 大 模块 或 者 需要 重复 测试 的 模 
块 s ， 手 工 检测 是 枯燥 的 、 容 易 出 错 的 ,在 这 种 情况 下 ， 测 
试 平台 除了 产生 输入 以 外 ， 还 必须 检测 结果 的 正确 性 。 

测试 平台 自身 检测 的 方法 是 实例 化 两 个 独立 的 模块 并 比较 
它们 的 输出 ， 如 图 7-17 所 示 ( 男 外 一 种 方法 是 使 用 7.3 节 所 示 
的 反 敬 数 )。 图 7-17 中 测试 平台 创建 模块 prime (图 7-2) 的 一 
个 实例 和 模块 primel (图 7-6) 的 一 个 输入 .16 种 输入 模 
式 应 用 到 两 个 模块 ， 对 于 任何 一 个 模式 ， 如 果 两 个 模块 的 输 
出 不 一 致 ， 那 么 变量 check 被 设置 为 1。 检 测 完 所 有 的 输入 
值 后 ， 基 于 check 的 值 就 能 指明 是 PASS 还 是 FAIL, 


module test primel ; 


reg [3:0] in ; 
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图 7-16 基于 图 7-2 模块 的 测试 
台 (图 7-15) 的 输出 


reg check ; // 两 个 模块 输出 不 匹配 时 ，check 设 置 为 1 


wire isprime0, isprimel ; 


// 实例 化 两 种 实现 
prime pO(in, isprimeO) ; 


primel pl(in, isprimel) ; 


initial begin 
in = 0 w check = 0 ; 


repeat (16) begin 
#100 
if (isprime0 !== isprimel) check = 1 ; 


in = jn+l ç 


end 


if (check != 1) $display("PASS") ; else $display ("FAIL") ; 


end 
endmodule 





图 7-17 使 用 第 二 个 素数 模块 的 实现 来 检测 结果 的 测试 平台 


从 技术 上 说 ，repeat 语句 是 可 综合 的 ， 但 是 我 们 不 鼓励 这 样 做 。 


DO 


这 种 回归 测试 就 能 够 发 现 这 些 错 误 。 


O 在 这 个 例子 中 ， 因 为 这 两 个 实现 的 复杂 度 几乎 相同 ， 所 以 比较 起 来 ， 不 能 说 出 哪个 更 具有 优势 ， 但 是 ,在 其 


他 情况 下 ， 简 单 的 不 可 综合 的 描述 适合 用 于 比较 。 


常见 的 做 法 是 定期 ( 如， 每 天 晚上 ) 对 整个 设计 重新 运行 测试 。 由 于 部 分 设计 被 改变 会 造成 意 想不到 的 错误 ， 
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在 测试 平台 中 对 信号 进行 比较 时 ,使 用 Verilog 操作 符 = = = 和 ! = = 而 不 是 使 用 = = Al! 
-来 检测 是 否 相 等 。 使 用 Verilog 中 的 运算 符 = = 判断 1'bl = =1'bx 和 1'b0 = =1'bx, 两 
个 比较 结果 都 为 真 ， 使 用 不 等 于 运算 符 (! =) 判断 1'bl! =1'bx 和 1'b0! =1'bx, 两 
个 比较 结果 都 为 假 。 当 出 现 不 定 态 x 时， 应 该 输出 不 正确 ,但 出 现 输 出 正确 的 情况 ， 这 时 我 们 
应 该 使 用 运算 符 = = = 和 ! = = 对 4 种 状态 (0, 1, x, z) 都 进行 比较 , 1'bl = = =1'bx E 
较 结果 为 假 ， 这 样 就 能 使 设计 者 发 现 这 类 常见 错误 。 

例 7-5 温度 计 编码 检测 器 测试 平台 

编写 一 个 Verilog 测试 平台 ， 同 时 检测 例 7-1~ 例 7-4 的 模块 是 否 正 确 。 

图 7-18 所 示 的 测试 平台 需要 用 户 手 工 检 测 therm_assign 模块 的 输出 是 否 正 确 。 我们 把 
其 他 三 个 模块 的 输出 与 therm_assign 模块 的 输出 进行 比较 ， 如 果 相 等 就 显示 通过 ， 不 相等 
就 显示 失败 ， 这 样 就 能 检验 三 个 模块 是 否 正 确 。 测 试 的 输出 (图 7-19) 证 明了 Verilog 的 正 
确 性 。 


module therm test ; 
reg [3:0] in; 
reg check; 
wire £0, El, £2, Ey 


therm_assign m0 (in, t0); 
therm_case ml(in, t1); 
therm_casex m2(in, t2); 
therm_struct m3(in, t3); 


initial begin 

in. = 0; 

check = 0; 

repeat (16) begin 
#100; 
$display("in = %4b therm Iib", in, t0); 
if (€0 == €1) check 1; 
1f (€O !== t2) check = 1; 
if (tO !== t3) check T 


in ia + Jš 


end 
if (check != 1) $display ("PASS") ; 
else $display ("FAIL"); 


end // initial begin 
endmodule // therm_test 





FA 7-18 例 7-1~ 例 7-4 四 种 温度 计 编码 检测 器 的 测试 平台 


7.3 实例 : 七 段 译 码 器 
本 节 中 我 们 通过 检验 七 段 译 码 器 的 设计 介绍 常量 定义 、 信 和 号 拼接 和 使 用 反 函 数 检测 。 
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通过 点 亮 7 个 发 光 段 的 一 个 或 多 个 显示 一 个 1 位 十 进 制 数 。 这 些 段 排列 成 数字 8 的 形状 ， 


如 图 7-20 上 面部 分 所 示 ，7 个 段 从 0 ~ 6 进行 编号 。 七 段 
译 码 器 接收 一 个 4 位 输入 信号 bin [3: 0], 产生 一 个 7 
位 输出 信号 segs [6: 0]， 即 需要 点 亮 七 段 的 一 部 分 段 
用 来 显示 由 bin 编码 的 数字 。 人 例如， 如果“4” 的 二 进 制 
编码 0100， 作 为 七 段 译 码 器 的 输入 ,那么 输出 是 
0110011， 则 表示 点 亮 0、1、4 和 5 段 ， 显 示 数 字 4。 

用 Verilog 描述 七 段 译 码 器 的 第 一 步 是 定义 10 个 常 
量 ， 每 个 常量 都 指出 要 显示 特定 数字 需要 点 亮 哪 些 段 。 
图 7-20 定义 了 10 个 常量 ，ss_0 到 ss_9。 用 'define 结 
构 定 义 常 量 。 每 个 'define 语句 都 把 一 个 常量 值 赋 给 一 
个 常量 名 。 例如， 把 一 个 7 位 字符 串 值 0110011 赋值 给 党 
量 名 SS_4。 

定义 常量 有 两 个 理由 。 首 先 ， 使 用 常量 名 而 不 是 值 ， 
使 代码 更 具有 可 读 性 和 可 维护 性 。 其 次 ， 改 变 值 就 能 改变 
常量 的 用 法 。 例 如 ， 假 设 我 们 决定 让 显示 “9” 的 最 下 面 
一 个 段 不 亮 ， 那 么 我 们 只 要 改变 ss_9 的 值 ， 把 1111011 
改 成 1110011， 每 个 使 用 ss_9 的 地 方 就 会 自动 进行 改变 。 
如 果 没 有 定义 常量 ,我们 只 能 手工 改变 每 个 常量 值 ， 这 个 
过 程 中 很 可 能 遗漏 某 个 值 。 
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图 7-19 图 7-18 测试 平台 的 输出 ,我 
们 必须 手工 检测 每 个 输出 是 
否 正 确 


// 七 位 段 码 ， 一 位 表示 一 段 ， 当 某 一 位 为 高 电 平时 ， 点 亮相 应 的 段 


// 位 6543210 对 应 的 段 如 下 
// 

// 6666 

ae 

// 

if 

// 

// 

// 


// 


*b1111110 
‘define is “bol10000 
‘define = !'b1101101 
‘define = ‘b1111001 
‘define fe. ’b0110011 
‘define = 'b1011011 
‘define SS ‘61011111 
‘define SS_ ‘b1110000 
‘define SS 8 7'b1111111 
‘define _9 7'b1111011 





图 7-20 定义 七 段 译 码 需 常量 





// sseg 一 一 把 4 位 二 进 制 数 转 化 为 七 位 段 码 

// 

// big 一 一 4 位 二 进 制 输入 

// segs 一 一 /位 输出 ,输出 的 常量 值 已 经 在 上 面 定义 


module sseg(bin, segs) ; 
input [3:0] bin ; // 4 位 二 进 制 输入 
output [6:0] segs ; // 七 位 段 码 
reg [6:0] segs ; 


always@(*) begin 
case (bin) 
0: segs ‘SS O ; 
"SS 1 ; 
`SsS_2 ; 
'SS_3 ; 
“SS 4 ; 
'SS_5 ; 
‘SS 6 ; 
"SS “ 3 
‘SS 8 ; 
: segs ‘SS 9 ; 
default: segs = 7’b0000000 ; 
endcase 


segs 
segs 
segs 
: segs 
>: segs 
: segs 


: segs 


" " Ii li Ii I II lI i] 


: segs 


wow O + OA Un tk Wn HP 


end 


endmodule 





图 7-21 使 用 case 语句 实现 七 段 译 码 器 


常量 定义 中 给 出 一 个 用 Verilog 描述 数字 的 语法 实例 。 一 般 地 ，Verilog 中 数字 描述 方法 是 
<size > <base > < value >, <size > 是 一 个 十 进 制 数 ， 表 示 数 值 的 宽度 (以 位 为 单 
位 ) 。 上 面 例子 中 每 个 常量 定义 位 数 为 7， 表 示 每 个 常量 都 是 7 位 宽 。 注 意 3'b0 和 71'b0 是 两 
个 不 同 的 数 ， 虽 然 值 都 是 0， 但 是 第 一 个 数 是 3 位 宽 ， 而 第 二 个 数 是 7 位 宽 。 <base > 分 别 为 
'b. 'd. 'of'h, 'b 表示 是 二 进 制 数 ，'d 表示 十 进 制 数 ，'o 表示 八进制 数 (基数 是 8 ) ， 
'h 表示 十 六 进 制 数 (基数 是 16) 。 图 7-20 的 常量 定义 中 所 有 数 都 是 二 进 制 数 。 图 7-22 所 示 的 
七 段 译 码 器 反 函 数 模 块 使 用 的 是 十 六 进 制 数 。 < value > 是 用 基数 表示 的 数值 。 

现在 我 们 已 经 定义 了 常量 ， 在 编写 七 段 译 码 器 模块 sseg 时 ， 就 可 以 直接 使 用 常量 了 ， 如 
7-21 所 示 。 使 用 case 语句 描述 模块 的 真 值 表 ， 和 7. 1. 2 节 中 描述 素数 函数 时 一 样 。 使 用 前 
面 定 义 好 的 常量 作为 输出 值 。 使 用 已 经 定义 好 的 常量 时 ， 名 字 前 加 一 个 反 引 号 ， 例 如 ， 当 bin 
落 是 4 时 ， 输 出 是 'Ss_4 ， 前 面 SS_4 已 经 被 赋值 为 0110011。 与 case 语句 右面 全 是 位 字符 串 
相 比 ， 这 些 使 用 助 记 符 常 量 名 的 代码 更 具有 可 读 性 。 当 输入 值 不 是 在 0 ~9 的 范围 内 时 ， 模 块 
sseg 输出 为 0 一 一 数码 管 是 灭 的 。 

为 了 帮助 测试 七 段 译 码 器 ， 我 们 定义 一 个 七 段 译 码 器 反 函 数 模块 如 图 7-22 所 示 。 模 块 in- 
vsseg 的 输入 是 一 个 7 位 字符 串 segs。 如 果 输 入 是 图 7-20 定义 的 十 个 编码 之 一 ， 那 么 电路 输 
出 bin 为 相应 的 二 进 制 编码 ， 输 出 valid 为 1。 如 果 输 入 为 全 0 ( 当 输 入 超出 范围 时 ， 译 码 器 
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输出 为 0) ， 那 么 输出 为 valid =0，bin =0。 如 果 输 入 是 其 他 的 编码 ， 那 么 输出 是 valid = 
0, bin =s 


// invsseg 一 一 如 果 输 入 信号 ， 即 输入 的 七 位 段 码 有 效 ， 那 么 把 七 位 段 码 转化 成 二 进 制 
Vif 
// segs 一 一 七 位 段 码 输入 
// bin 一 一 二 进 制 输出 
// valid 如 果 输 入 七 位 段 码 有 效 ， 则 为 真 
// 
ff segs = 合法 的 七 位 段 码 (0-9) ==> valid = 1, bin = 二 进 制 值 
// segs =0 ==> valid = 0, bin = 0 
segs = 任何 其 他 代码 ==> valid = 0, bin 


module invsseg(segs, bin, valid) ; 
input [6:0] segs ; // 七 位 段 码 输入 
output [3:0] bin ; // 4 位 二 进 制 输出 
output valid ; // 如 果 输 入 段 码 有 效 ， 那 么 valia 为 真 
reg [3:0] bin ; 
reg valid ; 


always@(*) begin 
case (segs) 
‘SS_0: {valid,bin} 5’h10 ; 
‘SS_1: {valid,bin} 5’hil ; 
‘SS_2: {valid,bin} 5'h12 ; 
‘SS_3: {valid,bin} 5'h13 ; 
‘SS_4: {valid,bin} 5'h14 ; 
‘SS_5: {valid,bin} 5'h15 ; 
‘Ss 6: {valid,bin} 5'h1i6 ; 
‘SS_7: {valid,bin} 5¢h17 ; 
‘ss 8: {valid,bin} 5'h18 ; 
‘ss 9: {valid,bin} 5'h19 ; 
0: (valid,bin) = 5'h00 ; 
default: (valid,bin) = 5'h01 ; 
endcase 
end 
endmodule 





图 7-22 用 Verilog 描述 七 段 译 码 器 反 函 数 ， 检 验 七 段 译 码 右 的 输出 


七 段 译 码 器 反 函 数 也 使 用 了 case 语句 来 描述 真 值 表 。 每 个 case 语句 分 支 中 只 使 用 
一 个 赋值 语句 对 valid 和 bin 进行 赋值 ， 我 们 把 两 个 信号 拼接 起 来 ， 并 把 一 个 5 位 拼接 值 
赋 给 它 。 把 两 个 或 多 个 信和 号 用 去 号 “,” 隔 开放 在 大 括号 || 里 就 把 这 些 信 号 拼接 成 了 一 个 信 
号 , 长度 等 于 每 个 信和 号 长 度 之 和 。 这 样 ， 表 达 式 (valid, bin) 是 一 个 5 位 信号 ，valid 是 
第 4 位 ，bin 是 第 0 ~3 位 。5 位 拼接 信号 可 以 用 在 表达 式 的 左边 ， 也 可 以 用 在 表达 式 的 右边 。 
例如 ,语句 
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{valid,bin} = 5'hl4 ; 


与 下 面 一 段 代 码 等 价 : 
begin 
valid = I'L ; 
bin = 4'h4 ; 
end 


首先 ， 把 逻辑 值 1 赋值 给 valid (拼接 信号 的 第 4 位 ) ， 然 后 把 一 个 十 六 进 制 的 4 赋值 给 bin 
(拼接 信和 号 的 低 4 位 (0 ~3) ) 。 与 给 两 个 信号 分 别 赋值 的 代码 相 比 ， 赋 值 给 拼接 信号 的 代码 更 
紧凑 ， 更 具有 可 读 性 。 

现在 已 经 定义 了 七 段 译 码 器 模块 sseg 和 它 的 反 函 数 模块 invsseg， 我 们 就 可 以 编写 一 个 
测试 平台 使 用 反 函 数 模块 来 检验 译 码 器 本 身 了 。 图 7-23 是 一 个 测试 平台 。 测 试 平台 实例 化 译 
码 器 和 译 码 器 反 函 数 模块 。 译 码 器 的 输入 是 bin_in， 输 出 是 segs， 译 码 器 反 函 数 电 路 的 输 
入 是 segs, 输出 是 valiqd 和 bin_out。 

测试 平台 中 实例 化 模块 和 连接 模块 的 后 面 ， 包 含 一 个 initial 单元 , 对 16 种 可 能 输入 执 
行 16 次 循环 体 。 如 果 输 入 在 范围 内 (从 0 ~9)， 那 么 检测 bin_in = = =bin_out, valid Æ 
否 为 1。 如果 这 两 个 条 件 都 不 满足 ,那么 error =1。 类 似 地 ， 如 果 输 入 超出 范围 ， 则 检测 
bin_out #l valid 是 否 都 为 0。 注 意 ， 也 可 以 把 检测 条 件 写成 : 


{valid, bin_out} !== 0 


在 编写 测试 平台 时 ,使 用 反 函 数 模 块 检测 组 合 模块 的 功能 是 一 项 常用 技术 。 尤 其 在 检测 算 
术 电 路 时 特别 有 用 ( 见 第 10 章 )。 例 如 ， 编写 一 个 平方 根 单元 的 测试 平台 ,我 们 可 以 对 结果 进 
行 平方 (一 个 非常 简单 的 操作 ) 并 检测 是 否 能 得 到 初始 值 。 

在 测试 平台 中 ,使 用 的 反 函 数 模 块 也 是 一 种 测试 模块 ， 这 在 测试 中 非常 普遍 。 测 试 平台 中 
的 测试 模块 与 软件 中 的 断言 类 似 。 引 和 这些 模块 的 目的 是 用 来 检测 那些 不 变量 和 总 是 为 真 的 条 
件 ( 如 两 个 模块 不 能 同时 驱动 总 线 ) ， 虽 然 有 些 元 余 ， 但 必 不 可 少 。 因 为 测试 模块 仅 存 在 于 测 
试 平台 中 ， 所 以 没有 任何 成 本 。 它 们 不 会 被 综合 也 不 会 占用 芯片 面积 ， 但 仿真 时 起 着 非常 重要 
的 作用 。 


// 使 用 译 码 器 检测 七 段 译 码 器 
// 注意 两 段 代码 使 用 相同 的 一 组 常量 定义 ， 所 以 不 会 捕 提 常量 定义 中 的 错误 


module test_sseg ; 
reg [3:0] bin_in ; 
wire [6:0] segs ; 
wire [3:0] bin_out ; 译 码 器 的 二 进 制 输出 
wire valid ; 译 码 器 的 输出 valida 


reg error ; 


// 实例 化 译 码 器 和 检测 器 


sseg ss(bin_in, segs) ; 





invsseg iss(segs, bin_out, valid) ; 


图 7-23 使 用 反 函 数 测试 输出 的 七 段 译 码 器 测试 平台 
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// 遍历 16 种 输入 
initial begin 
bin_in = 0 ; error = 0 ; 
repeat (16) begin 
#100 
// 把 下 面 一 行 代码 的 注释 去 掉 ， 以 便 显示 每 种 情况 


// $display("%Sh %b th %b",bin_in,segs, bin out, valid) 


if(bin_in < 10) begin 


if((bin_in !== bin out)|| (valid !== 1)) begin 
Sdisplay("ERROR: th %b %h %b",bin_in,segs, bin out, valid) 


( 1 
error = 1 +š 


end 
end 
else begin 
if((bin_out !== 0) || (valid !== 0)) begin 


Sdisplay("ERROR: Sh %b th %b",bin_in,segs, bin out, valid) 


error = 1; 
end 
end 
bin_in = bin_in+l ; 
end 
if (error == 0) $display("TEST PASSED") 
end 


endmodule 


图 7-23 (48) 


小 结 





, 


, 


本 章 我 们 学 习 了 用 Verilog 描述 组 合 逻 辑 函 数 的 方法 ， 真 值 表 能 直接 转化 成 Verilog 中 的 


case 语句 : 


always @(*) begin 


case (in) 
1,2,3,5,)7,11,13: Lsprime = 1°bi 7 
default: isprime = 1'bO0 ; 
endcase 
end 


本 例 中 ， 我 们 使 用 一 个 case 分 支 处 理 所 有 输出 为 1 的 输入 组 合 ， 默 认 case 分 支 使 输出 
为 0。 为 了 给 case 语句 中 的 输出 isprime ( 原 书 有 误 一 一 译 者 注 ) 赋值 ， 必 须 声明 它 为 reg 


类 型 9 ° 


Verilog 中 的 casex 语句 与 case 语句 类 似 , 但 casex 语句 允许 case 分 支 中 某 些 位 包含 
X (无关 状态 ) 的 情况 。 当 需要 指定 某 些 输入 位 上 的 特定 模式 从 而 使 其 余 位 无 关 时 ，casex if 


句 很 有 用 。 
Verilog 中 assign 语句 可 以 直接 编写 逻辑 等 式 





© 因为 1sprime 与 寄存 器 无 关 ， 所 以 这 个 关键 字 的 选择 不 太 好 ， 严 格 意义 上 说 这 个 函数 是 组 合 函 数 。 
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assign majority = (a & b) | (a & c) | (b & c) ; 


被 赋值 的 变量 一 定 要 声明 成 wire 类 型 ， 如 这 个 例子 中 的 majority， 模 块 的 输出 变量 默认 为 
wire 类 型 ， 就 不 需要 声明 了 。 

Verilog 逻辑 功能 可 以 封装 在 module 里 。 模 块 声明 包括 一 个 参数 列表 ， 这 个 列表 指定 模块 
的 输入 和 输出 信号 。 我 们 还 可 以 实例 化 模块 ， 通 过 相同 信号 把 一 个 模块 的 输出 连接 到 另 一 个 模 
块 的 输入 上 。 

通过 编写 模块 的 测试 平台 可 以 验证 Verilog 模块 。 不 像 模块 最 终 可 以 综合 成 硬件 ， 测 试 平 
台 不 能 被 综合 而 且 要 使 用 不 同 风格 的 Verilog 编写 。 测 试 平台 实例 化 要 测试 的 模块 ， 声 明 模块 
的 输入 和 输出 信号 ， 然 后 在 initial 单元 中 指定 一 系列 的 测试 模式 。 理 想 情 况 下 ， 测 试 平台 
能 够 验证 模块 功能 并 给 出 通过 /失败 的 提示 。 我 们 将 会 在 第 20 章 更 详细 地 讨论 验证 的 细节 。 


文献 说 明 


关于 Verilog 更 多 内 容 可 以 参考 Palnitkar 的 《Verilog HDL) [89] 或 者 关于 Verilog 的 其 他 
书籍 。 几 本 好 的 Verilog 参考 书 都 能 从 网 上 获得 。 


习题 

7.1 使 用 case 语句 实现 判断 斐 波 那 契 数 。 电 路 的 输入 是 一 个 4 位 数 ， 如 果 输 入 是 斐 波 那 契 数 (0，1， 
2, 3, 5，8，13) ， 那 么 输出 为 真 。 用 Verilog 描述 此 电路 ， 必 须 使 用 case 语句 实现 。 

7.2 使 用 casex 语句 实现 判断 斐 波 那 契 数 。 电 路 的 输入 是 一 个 4 位 数 ， 如 果 输 入 是 斐 波 那 契 数 (0, 1, 
2,，3,，5，8，13) ， 那 么 输出 为 真 。 用 Verilog 描述 此 电路 ， 必 须 使 用 casex 语句 和 最 小 化 逻辑 
函数 。 

7.3 使 用 assign 语句 实现 判断 斐 波 那 契 数 。 电 路 的 输入 是 一 个 4 位 数 ， 如 果 输 入 是 斐 波 那 契 数 (0, 
1，2,，3,，5，8，13) ， 那 么 输出 为 真 。 用 Verilog 描述 此 电路 ， 必 须 使 用 assign 语句 和 最 小 化 逻 
辑 函 数 。 

7.4 使 用 结构 描述 实现 判断 斐 波 那 契 数 。 电 路 的 输入 是 一 个 4 位 数 ， 如 果 输 入 是 斐 波 那 契 数 (0，1，2， 
3,，5，8，13) ， 那 么 输出 为 真 。 用 Verilog 程序 描述 此 电路 ， 必 须 使 用 结构 描述 ， 直 接 实例 化 AND 
和 OR 门 ， 还 需要 分 别 编写 AND 和 OR 模块 。 

7.5 编写 裴 波 那 契 数 程序 的 测试 平台 。 编 写 测 试 平台 ， 用 来 验证 习题 7.1 ~ 习题 7.4 执行 是 否 正确 。 指 
出 在 4 个 模块 中 ， 哪 一 个 模块 最 容易 编写 和 维护 ? 

7.6 对 斐 波 那 契 数 程序 进行 逻辑 综合 。 使 用 综合 工具 对 习题 7. 1 ~ 习题 7.4 实现 的 电路 进行 综合 ， 为 每 
个 综合 后 的 电路 画 出 逻辑 电路 图 ， 比 较 每 个 电路 的 不 同 。 

7.7 5 位 素数 函数 电路 。 电 路 的 输入 是 一 个 5 位 数 ， 如 果 输 入 是 素数 (2, 3, 5, 7, 11, 13, 17, 19, 
23, 29, 31) ， 那 么 输出 为 真 。 用 Verilog 程序 描述 此 电路 , 在 case、casex、assign、 结 构 描述 
中 选择 一 种 最 合适 的 方法 实现 ， 并 说 明 为 什么 你 选择 的 方法 是 最 合适 的 ? 

7.8 3 的 倍数 电路 。 电 路 的 输入 是 一 个 4 位 数 ， 如 果 输 入 是 3 的 倍数 (3, 6, 9，12，15) ， 那 么 输出 为 
É. HI Verilog 程序 描述 此 电路 ,在 case、casex、assign， 结 构 描述 中 选择 一 种 最 合适 的 方法 
实现 ， 并 说 明 为 什么 你 选择 的 方法 是 最 合适 的 ? 

7.9 测试 平台 。 为 习题 7.8 中 3 的 倍数 电路 编写 Verilog 测试 平台 。 

7.10 十 进 制 斐 波 那 契 数 电 路 。 电 路 的 输入 是 一 个 在 0 ~9 范围 内 的 4 位 数 ， 如 果 输 入 是 斐 波 那 契 数 (O, 
1, 2, 3, 5, 8) ， 那 么 输出 为 真 ， 如 果 输 入 是 10 ~ 15 ， 输 出 为 无 关 状 态 。 用 Verilog 程序 描述 此 电 
BR, 在 case、casex、assign， 结 构 描述 中 选择 一 种 最 合适 的 方法 实现 ， 并 说 明 为 什么 你 选择 
的 方法 是 最 合适 的 ? 

7.11 5 的 倍数 电路 。 如 果 电 路 的 5 位 二 进 制 数 输入 是 5 的 倍数 ， 那 么 输出 为 真 ， 用 Verilog 程序 描述 此 
电路 。 
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平方 电路 。 如 果 电 路 的 8 ie — Eh a A F KB, 4，9，…， 那 么 输出 为 真 ， 用 Verilog 
程序 描述 此 电路 。 

立方 电路 。 如 果 电 路 的 8 位 二 进 制 数 输入 是 立方 数 ， 即 1，8，27，64,，…， 那 么 输出 为 真 ， 用 
Verilog 程序 描述 此 电路 。 | 

使 用 case 语句 求 位 逆序 。 编 写 把 5 位 输入 的 逆序 输出 的 Verilog 模块 。 例 如 ， 如 果 输 入 是 01100， 
那么 输出 是 00110; 如 果 输 入 是 11110， 那 么 输出 是 01111。 必 须 使 用 case 语句 实现 。 

使 用 assign 语句 求 位 逆序 。 使 用 assign 语句 和 连接 操作 符 ， 编写 把 5 位 输入 的 逆序 输出 的 
Verilog 模块 。 例 如 ， 如 果 输 入 是 01100, 那么 输出 是 00110; 如 果 输 入 是 11110, 那么 输出 
是 01111。 

下 一 个 斐 波 那 契 数 ， 工 。 编 写 Verilog 模块 ， 其 输入 是 4 位 数 ， 输 出 是 代表 下 一 个 斐 波 那 契 数 的 5 
位 数 。 输 入 和 输出 的 映射 如 下 所 示 : 

f(0001) = 00010, 

f(0010) = 00011, 

f(0011) = 00101, 

f(0101) = 01000, 

f(1000) = 01101, 

f(1101) = 10101. 


假设 输入 是 合法 的 斐 波 那 契 数 。 如 果 输 入 无 效 ， 那 么 输出 X。 如果 对 电路 不 进行 测试 ， 那 么 它 就 
不 会 工作 ， 为 了 解决 这 个 问题 (习题 7. 17 和 习题 7. 18 ) ， 我 们 忽略 了 斐 波 那 契 数列 前 面 的 0， 只 
使 用 1，2，3，5。，… 

下 一 个 斐 波 那 契 数 ， 工 。 修 改 习 题 7. 16 的 斐 波 那 契 电路 ， 增 加 一 个 输出 信号 valid， 当 输入 是 一 
个 合法 的 斐 波 那 契 数 时 ， 为 1， 和 否则 为 0， 模块 的 其 他 功能 不 变 ， 仍 输出 下 一 个 5 位 斐 波 那 契 数 。 
下 一 个 斐 波 那 契 数 ， 亚 。 修 改 习 题 7. 17 的 斐 波 那 契 电路 ， 增 加 两 个 输出 信号 rst #livalid, 如 
果 rst =1， 那么 模块 输出 (valid 和 下 一 个 数 ) 为 0。 如 果 ivalia 为 0, 无 论 输 入 为 何 值 ， 输 
出 valid 信和 号 都 为 0。 如 果 rst 为 0 而 且 ivalia 为 1, 那么 电路 和 习题 7. 17 一样 。 使 用 casex 
语句 实现 这 个 逻辑 ， 要 求 不 超过 8 条 语句 和 1 条 默认 语句 。 

FPGA 实现 。 使 用 FPGA 映 象 工具 (如 Xilinx Foundation) 把 图 7-21 的 七 段 译 码 器 映 象 到 FPGA Eo 
使 用 平面 规划 工具 观察 FPGA 的 布局 ,综合 过 程 使 用 了 多 少 可 配置 逻辑 块 ? 

七 段 译 码 器 。 修 改 七 段 译 码 器 电路 ， 使 得 当 输 入 为 10 ~ 15 时 ,输出 字符 “A” 到 “F”( 小 写字 符 
“b” 和 “d”)。 

七 段 译 码 器 反 函 数 。 修 改 七 段 译 码 器 反 函 数 电 路 ， 使 得 当 输 入 为 7'b1111011 或 者 7'bl1110011 
时 ， 都 输出 “9”， 区 别 是 当 输 入 为 7'b1111011 时 ， 最 底 端的 段 (第 3 段 ) 亮 ， 输 入 为 另 一 个 值 
时 ， 最 底 端 的 段 (第 3 Be) Ko 

测试 平台 。 修 改 图 7-15 的 测试 平台 ， 检 测 输出 是 否 正确 并 指明 测试 是 通过 还 是 失败 。 

使 用 case 实现 乘法 。 使 用 case 语句 编写 Verilog 模块 ， 计 算 两 个 2 位 数 的 乘积 并 输出 一 个 4 位 
数 的 结果 (如 10, x11, =0110, ) 。 我 们 将 会 在 第 10 ~ 12 章 学 习 设 计 一 个 真正 的 乘法 器 。 
发 现 第 一 个 1 的 位 置 。 发 现 第 一 个 1 的 位 置 电路 能 指出 输入 的 最 高 有 效 1 的 位 置 。 使 用 casex if 
句 编写 Verilog ， 实 现 发 现 第 一 个 1 的 位 置 ， 输 入 为 16 位 数 ， 输 出 为 一 个 4 位 信号 ， 它 表明 第 一 个 
1 的 位 置 。 如 果 输 入 中 没有 1， 和 输出 为 1。 测试 这 个 电路 ， 我 们 将 会 在 第 8 章 讨论 其 他 实现 方法 。 
因 式 分 解 电 路 。4 位 输入 变量 为 in, 输出 变量 为 two, three, five, seven, eleven 和 
thirteen。 如 果 输 出 变量 的 对 应 值 乘 积 等 于 输入 ， 那 么 相应 的 输出 变量 为 高 。 例 如 ， 当 输入 是 6 
时 ， 变 量 two Mil three 为 高 ， 其 他 输出 为 低 。 
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组 合 电路 基础 单元 





在 数字 系统 设计 中 ,一 些 相 对 较 小 的 模块 经 常会 被 重复 使 用 ， 如 译 码 器 、 多 路 选择 器 、 编 
码 器 等 。 这 些 基础 单元 是 现代 数字 设计 的 基础 。 通 常 我 们 在 实现 一 个 模块 功能 时 会 将 这 些 基础 
单元 组 合 起 来 ， 而 不 是 先 列 出 真 值 表 ， 再 根据 表达 式 直接 进行 多 辑 综合 。 

在 20 世纪 70 年 代 和 80 年 代 ， 大 多数 数 字 系 统 都 是 由 小 型 集成 电路 构成 的 ， 而 这 些 集成 
电路 或 多 或 少 包含 了 一 些 基 础 单元 。 例 如 ,广泛 使 用 的 7400 系列 TTL 逻辑 [102]， 包 含 了 许 
多 多 路 选择 器 和 译 码 器 。 在 那个 年 代 ， 数 字 系统 设计 手段 主要 是 从 TIL 数据 手册 中 选择 合适 的 
基础 单元 ， 并 把 它们 组 织 起 来 形成 模块 。 今 天 ， 大 多 数 逻 辑 是 用 ASIC 或 FPGA 实现 的 ， 设 计 
者 不 再 受 TTL 数据 手册 中 所 提供 的 基础 单元 的 限制 。 但 是 ， 这 些 基 本 基础 单元 在 建立 数字 系统 
时 依然 有 用 。 


8.1 多 位 信号 的 表示 

本 书 中 ， 我 们 使 用 总 线 符 号 来 表示 一 根 单线 上 的 多 位 信号 。 例 如 ， 图 8-1 中 ,我 们 用 一 根 
单线 表示 8 位 信号 broo 信号 上 的 斜 线 表示 该 线 为 多 位 信号 。 斜 线 下 面 的 “8” 表 示 总 线 宽度 
为 8 位 。 

如 果 想 选择 总 线 中 的 其 一 位 或 某 几 位 ， 可 以 通过 和 斜 线 连接 器 来 实现 。 例 如 ， 图 8-1 中 的 
bi, b; 表示 一 位 信号 ，b;s.; 表 示 3 位 信号 。 每 个 斜 线 连接 器 上 标 有 对 应 的 位 。 所 选择 的 位 可 以 重 
Z, Wb, 和 bs.s。bs3 本 身 是 一 个 多 位 信号 ， 因 此 与 之 相应 的 斜 线 上 标 有 数字 “3”。 


8.2 译 码 器 


通常 情况 下 ， 译 码 器 可 以 将 一 种 编码 转换 为 另 一 种 编码 。7. 3 节 中 将 二 进 制 信号 转换 为 对 应 
的 七 段 显 示 码 的 电路 就 是 一 个 译 码 器 。 单 独 使 用 时 ， 译 码 器 一 词 往往 是 指 将 二 进 制 转换 为 独 热 码 
的 一 种 译 码 电路 。 该 译 码 器 可 以 把 一 个 二 进 制 编码 符号 (每 一 个 位 模式 代表 一 个 符号 ) 转换 为 对 
应 的 独 热 码 (同一 时 间 最 多 只 有 一 位 为 高 且 每 一 位 代表 一 个 符号 ) 。 在 8.4 rh, 我们 将 讨论 纺 
码 器 ， 它 的 逻辑 功能 与 译 码 器 相反 ， 也 就 是 能 够 将 独 热 码 转换 为 二 进 制 编码 。 

图 8-2 为 nm 译 码 器 的 原理 图 符号 ， 其 中 输入 信号 a 是 一 个 n 位 的 二 进 制 信号 ， 输 出 信 
号 6 是 一 个 位 (m=<2") 的 独 热 信号 。 表 8-1 为 3 -8 译 码 器 的 真 值 表 。 如 果 输 入 和 输出 均 为 
二 进 制 数 ， 当 输入 值 个 数 为 ?， 输 出 值 个 数 为 2 。 


bz, 





路 
n a w Š m 
I m<?" 
图 8-1 可 以 用 一 条 斜 线 并 在 斜 线 上 标注 宽度 的 方式 图 8-2 n-m PEB 98 JE 
来 表示 多 位 信号 或 一 组 总 线 。 通 过 斜 线 连接 图 符号 


器 还 可 以 从 这 组 总 线 中 选取 其 中 任意 一 个 或 
几 个 信号 (所 选 信号 允许 重复 出 现 ) 
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表 8-1 3 -8 译 码 器 真 值 表 。 该 译 码 器 将 一 个 3 位 二 进 制 输入 bin 转换 为 8 位 的 独 热 码 输 出 ohout 








图 8-3 是 用 Verilog HRKI n -m 译 码 器 。 该 模块 介绍 了 Verilog 中 参数 的 使 用 。 该 模块 通过 修 
MAR n 和 m， 将 一 个 模块 实例 化 为 不 同 输入 、 输 出 宽度 的 译 码 器 。 本 例 中 通过 语句 parame- 
ter n=2; 声明 n (输入 信号 宽度 ) 的 默认 值 为 2; 同 理 , m (输出 信号 宽度 ) 的 默认 值 为 4。 


// a 一 输入 为 二 进 制 数 (宽度 为 n ) 
// b 一 输出 为 独 热 码 ( 宽度 为 m) 


module Dec(a, b) ; 
parameter n=2 ; 


parameter m=4 ; 


input [n-1:0] a ; 
output [m-1:0] b ; 


assign b = l<<a ; 





endmodule 
图 8-3 n-m YARI Verilog 描述 
通常 情况 下 ， 模 块 将 按照 默认 参数 进行 实例 化 。 例 如 ， 下 面 的 代码 会 创建 一 个 2 -4 译 码 
器 ， 这 是 因为 默认 值 分 别 为 n =2 和 m=4: 
Dec dec24(a, b) ; 
当然 也 可 以 不 按照 默认 参数 值 进行 实例 化 。 一 般 对 于 这 样 一 个 参数 化 模块 ， 实 例 化 时 常 使 
用 以 下 方式 : 


<module name> #(<parameter list>) <instance name>(<port list>) ; 


例如 ， 想 实现 一 个 3 -8 译 码 器 ， 相 应 的 Verilog 代码 为 : 

Dec #(3,8) dec38(a, b) ; 
其 中 # (3, 8) 在 实例 化 Dec 模块 时 将 参数 RBH 3, m 设置 为 8， 实 例 名 为 dec38。 同 样 
实例 化 一 个 4 -10 译 码 器 可 使 用 语句 : 

Dec #(4,10) dec410(a, b) ; 
需要 注意 的 是 ,输出 宽度 m 是 无 须 等 于 2" 的 (n 为 输入 宽度 ) 。 在 许多 情况 下 (因为 不 是 所 有 
输入 状态 都 会 出 现 ) ， 实 例 化 一 个 小 于 全 宽 输出 的 译 码 器 是 有 用 的 。 例 如 ， 图 8-3 中 的 模块 采 
用 左 移 运 算 符 ~ < <” 根 据 输 入 a 将 1 移动 到 指定 位 置 ， 并 以 独 热 码 的 形式 将 结果 从 b 输出 。 
该 模块 中 输出 宽度 并 未 达到 最 大 值 。 





© Verilog 中 的 右 移 操作 符 为 > > 。 
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小 的 译 码 器 可 以 通过 与 门 实现 ， 如 图 8-4 中 的 2 -4 译 码 器 。 每 个 输入 端 通过 一 个 反 相 器 
取 反 。 每 一 个 与 门 选择 输入 信号 的 原 码 或 者 补 码 并 产生 相应 的 输出 。 例 如 ， 输 出 5b, 就 是 输入 
a, 和 a 与 运算 后 的 结果 ， 即 b, =a, Aa, 

大 型 译 码 器 可 以 由 小 型 译 码 器 构成 ， 图 8-5 为 6 -64 译 码 器 。6 位 输入 ai 被 分 成 3 路 2 位 
的 输入 ， 每 一 路 经 过 一 个 2 -4 译 码 器 译 码 产生 3 个 4 位 信号 x、y 和 zs。 实际 上 ， 这 一 过 程 可 以 
看 成 预 译 码 ， 通 过 预 译 码 一 个 6 位 的 二 进 制 输入 信和 号 转换 为 3 个 四 进 制 数 (基数 为 4) 。4 位 信 
号 x、y 和 = 分 别 代表 一 个 四 进 制 数 。 该 四 进 制 数 为 独 热 编码 ， 其 中 每 一 位 对 应 一 个 特定 的 值 : 
0,1,283, x, y Mz 信号 的 每 一 组 取 值 送 入 一 个 3 输入 与 门 ，64 个 3 输入 与 门 共产 生 64 个 
输出 信号 。 每 一 个 与 门 的 输出 b; 与 所 选 输入 信和 号 形成 的 四 进 制 数 对 应 ， 例 如 ， 输 出 b, (图 中 
未 画 出 ) 需要 与 x,、y, Az, 连 在 一 个 3 输入 与 门 上 ， 这 是 因为 27,。=1234。 


a, 





图 8-4 2 -4 详 码 器 的 原理 图 。 反 图 8-5 6 -64 译 码 右 原理 图 。3 个 2 -4 译 码 器 对 
相 器 阵列 形成 输入 的 反 人 码 ， 每 一 对 输入 信号 进行 预 译 码 ， 形 成 3 个 4 
与 门 陈列 产生 输出 位 的 独 热 信号 x*、y 和 z。 根据 预 译 码 结果 ， 


64 个 3 输入 与 门 阵列 产生 相应 的 输出 


在 构建 大 型 译 码 占 时 ， 为 了 减 小 逻辑 功效 ， 可 以 像 图 8-5 那样 采用 预 译 码 的 方式 将 请 人 系 
数 高 的 与 门 拆 分 ， 改 为 由 两 部 分 肩 入 系数 小 的 与 门 组 成 。 如 果 用 一 步 实现 图 8-5 中 的 6-64 译 
码 器 ， 可 以 采用 6 输入 与 门 来 完成 。 这 里 我 们 用 2 -4 译 码 器 进行 预 译 码 ， 实 际 上 是 用 3 个 2 输 
入 【每 个 预 译 码 器 中 取 一 个 ) 与 门 加 上 1 个 3 输入 与 门 代 蔡 了 6 输入 与 门 。2 输入 与 门 因 共享 
使 用 也 提高 了 使 用 效率 。 图 中 每 一 个 2 输入 与 门 ( 即 预 译 码 器 的 每 一 个 输出 ) 共享 使 用 了 16 
次 〈 即 每 一 次 都 和 另外 两 个 四 进 制 数组 合 ) 。 

设计 大 型 译 码 器 时 需要 在 布线 密度 和 逻辑 功效 之 间 进 行 折 中 。 一 个 单 级 的 怀 -2"” 译 码 器 需 
要 2n 个 线 径 才 能 将 输入 及 其 补 码 连接 到 全 部 2" 个 与 门 上 。 使 用 2 -4 预 译 码 器 也 需要 相同 数量 
的 线路 ， 因 为 4 根 线 才 能 表示 2 位 二 进 制 数 ， 它 们 的 补 码 用 一 个 4 位 的 独 热 码 表 示 。 但 这 种 方 
式 有 明显 的 优势 ， 虽 然 线 径 数 没有 增加 ， 但 输出 门 的 户 人 系数 却 减 少 了 一 半 。 此 外 功 耗 还 会 降 
低 ， 因 为 每 次 输入 改变 时 ， 采 用 独 热 编码 的 四 进 制 信号 充其量 有 两 位 状态 发 生 改变 (一 个 变 
高 ， 一 个 变 低 ) ， 而 在 单 极 结构 中 用 来 表示 真 / 假 的 4 位 二 进 制 信号 其 状态 都 有 可 能 发 生 改 变 。 

如 果 将 预 译 码 中 的 2 -4 译 码 变 为 3 -8 译 码 ， 此 时 考虑 更 多 的 是 一 种 折 中 。 虽 然 线 径 数量 增 
IMT 33% (从 2n 变化 为 8n/3)，, 但 换 来 的 是 输出 门扇 入 系数 降低 了 33% (从 n/2 变化 为 ww3 )。 
这 也 是 一 个 不 错 的 选择 。 不 过 ， 由 于 线 径 数 过 多 ， 青 大 一 些 的 预 译 码 器 (例如 ，4 - 16 译 码 
器 ) 就 很 少 使 用 了 。 一 个 i 输入 的 预 译 码 器 线 径 数 为 2.n/i， 所 需 与 门 的 输入 端 个 数 为 (n/i) 。 

对 于 大 型 译 码 器 ， 预 译 码 器 的 高 位 信号 往往 需要 精心 布线 ， 以 避免 输出 线 流 经 整个 与 门 阵 





列 。 例 如 ， 对 图 8-5 (实际 上 并 不 是 一 个 特别 大 型 的 译 码 器 ) 中 预 译 码 器 产生 的 x, fF E 0) 4 
个 与 门 进行 布线 时 ， 可 以 让 产生 x 的 与 门 与 产生 bs 的 与 门 相 邻 ， 让 产生 x, 的 与 门 与 产生 
的 与 门 相 邻 ， 以 此 类 推 。 对 于 输入 位 数 较 宽 的 译 码 器 ， 这 种 方式 能 够 减 小 线 径 长 度 。 当 对 
第 二 有 效 的 译 码 器 进行 布局 时 ， 通 常 该 译 码 器 会 重复 最 高 有 效 译 码 器 的 输出 ， 可 忽略 预 译 码 器 
共享 门 电路 的 优点 以 降低 布线 复杂 性 。 

n —2" 译 码 器 可 以 用 来 实现 任意 一 个 输入 的 逻辑 
函数 。 这 是 因为 译 码 器 能 够 产生 输入 逻辑 函数 所 区 
涵 的 全 部 2" 个 最 小 项 。 或 门 用 于 将 逻辑 函数 所 包含 的 
各 个 最 小 项 组 合 起 来 。 例 如 ， 图 8-6 是 用 3 - 8 译 码 器 
实现 的 判别 三 位 素数 的 函数 。 译 码 器 产生 所 有 最 小 项 
b;s。， 共 8 个。 或 门将 函数 的 蕴涵 项 b,、b,、b,、bs、b， 图 8-6 3-8 译 码 器 实现 的 判别 三 位 素 
合并 在 一 起 。 数 的 函数 

图 8-7 中 的 Verilog 模块 描述 了 如 何 用 译 码 器 实现 三 位 素数 判定 函数 。 虽 然 按 这 种 方式 判定 
素数 效率 不 高 ， 但 它 所 描述 的 功能 非常 紧凑 且 具 有 良好 的 易 读 性 。 它 与 符号 f= Dm (1, 2,3, 
5,7) 非常 接近 ， 采 用 好 的 综合 器 能 将 这 个 描述 简化 为 有 效 的 逻辑 。 





isprime 


module Primed(in, isprime) ; 
input [2:0] in ; 
output isprime ; 
wire [7:0] b ; 


// 计算 出 或 运算 所 需 的 最 小 项 


assign isprime = b[1] | b[2] | b[3] | b[5] | bI7] ; 


// 实例 化 一 个 3-8 译 码 器 
Dec #(3,8) d(in,b) ; 
endmodule 


图 8-7 使 用 3 -8 译 码 器 实现 3 位 素数 函数 的 Verilog 代码 





例 8-1 大 型 译 码 器 module Dec4tol6(a, b) ; 
编写 Verilog 模块 ， 利 用 2 -4 译 码 器 实现 4 一 input [3:0] a ; 


16 译 码 器 作为 基本 块 。 oct eee een 
wire = x, ; 
A 8-8 2) Verilog 代码 。 这 段 代 码 采 用 了 类 似 
图 8-5 中 的 电路 结构 。 首 先 实例 化 两 个 2 -4 译 码 // 实例 化 预 译 码 器 
器 d0 和 al， 分 别 对 aa 的 高 两 位 和 低 两 位 译 码 ， Dec A0 (all: Ol sy 3 
分 别 产 生 两 个 4 位 的 独 热 信号 x 和 y。 每 一 个 y 依 Deo GUIA Lara š 
次 与 全 部 x 进行 与 运算 形成 4 位 b 信 号。 这 段 代 
// 用 与 门 组 合 预 译 码 器 的 输出 
码 使 用 了 复制 运算 符 ， 8.3 节 中 将 进一步 讨论 。 assign b[3:0] x & {4{y{o] }} ; 
3 assign b[7:4] x & {4{y[1]}} ; 
8.3 多 路 选择 器 assign b[11:8] = x & {4{y[2]}} ; 
图 8-9 给 出 了 一 个 上 位 n HE 1 多 路 选择 器 的 原 assign b[15:12] = x & {a{y [3] }} ; 
1 c4to 
理 图 符号 。 该 电路 的 输入 端 为 n 个 上 位 信号 a，…，[ ertor 
Qi 以 及 一 个 nn 位 的 独 热 信号 s。 该 电路 根据 信号 8 ”图 8-8 使 用 两 个 2 -4 译 码 器 和 16 个 与 门 
选择 相应 的 输入 信号 a;,， 将 该 值 从 宽度 为 的 输 实现 的 4-16 译 码 器 
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出 端 5 输 出。 实际 上 ， 多 路 选择 器 就 像 一 个 太刀 n 所 的 开关 一 样 ， 根 据 选择 信号 从 n 路 输入 信 
号 中 选取 一 路 输出 。 

多 路 选择 器 在 数字 系统 中 常用 作 数 据 选择 器 。 例 如 ， 在 ALU 的 输入 端 通过 多 路 选择 器 
( 见 18.6 节 ) 选择 待 运算 的 数据 源 ， 也 可 以 将 ALU 输出 连接 到 RAM 地 址 线 的 多 路 选择 器 上 ， 
在 每 个 周期 里 为 RAM 提供 内 存 地 址 。 

图 8-10 给 出 了 一 位 4 选 1 多 路 选择 器 的 两 种 实现 方式 。 图 8-10a 
中 的 多 路 选择 器 是 用 与 门 和 或 门 实现 的 。 每 一 个 输入 a, 与 它 所 对 
应 的 选择 位 s, 做 与 运算 ， 所 有 与 门 产生 的 输出 再 进行 或 运算 。 由 
于 选择 信号 是 独 热 编码 ， 只 有 与 选择 输入 相对 应 的 选择 位 5, 为 
真 。 该 与 门 输出 为 w ， 其 他 与 门 输出 为 0。 这 样 ， 或 门 输出 将 会 是 Bod ah 
选择 输入 a;。 另 一 种 设计 方案 是 采用 三 态 缓冲 器 ， 如 图 8-10b 所 MS kini 多 路 选择 
示 。 三 态 缓冲 器 ( 见 4.3.4 节 ) 是 这 样 一 种 泌 辑 电路 ， 当 它 的 控制 SO 
输入 (底部 输入 ) 为 高 时 ， 输 出 等 于 输入 (符号 中 左 端的 输入 ) ; 当 控制 输入 为 低 时 ， 输 出 与 输 
入 断 开 (开路 ) 。 选 择 输入 s 为 高 时 ， 对 应 三 态 缓冲 器 打开 ， 输 出 a,; 其 他 三 态 缓冲 器 关闭 ， 相 
应 的 输入 与 输出 隔离 。 采 用 三 态 缓冲 器 的 好 处 是 有 利于 布线 ， 每 个 缓冲 器 在 布局 时 可 以 放置 在 数 
据 源 附近 ， 而 且 只 有 一 根 输出 线 连接 到 三 态 缓冲 器 上 (习题 8.7 要 求 使 用 CMOS 逻辑 门 实现 这 种 
结构 ) 。 相 反 ， 采 用 与 门 和 或 门 实现 时 ， 由 于 输出 线 要 连 至 最 后 的 或 门 ， 相 对 来 说 布线 会 更 困难 。 





a A 

So S, 

a, a 

Si S b 
a, Š a 

$ S2 

a a, 

s. $. 

a) b) 


图 8-10 4 选 1 多 路 选择 器 原理 图 。a) 使 用 与 门 和 或 门 实现 。b) 使 用 三 态 缓冲 器 实现 


图 8-11 是 用 Verilog 描述 的 任意 宽度 的 3 选 1 多 路 选择 器 。 该 模块 包括 3 个 上 位 的 数据 输 
入 端 a0、al 和 a2, 一 个 3 位 的 独 热 选择 输入 端 s 以 及 一 个 上 位 的 输出 端 b。 该 代码 通过 as- 
sign 语句 实现 了 与 图 8-10a 相似 的 功能 , 但 有 两 点 不 同 。 第 一 ， 这 是 一 个 三 输入 多 路 选择 器 ， 
有 3 个 与 门 而 不 是 4 个 ; 第 二 ， 更 重要 的 是 ， 由 于 该 多 路 选择 器 位 宽 为 k， 每 个 与 门 宽度 为 ， 


即 有 个 两 输入 与 门 。 


// 任意 宽度 的 3 选 1 多 路 选择 器 ， 选 择 信号 采用 独 热 编 码 
module Mux3 (a2, al, a0, s, b) ; 
parameter k = 1; 
input [k-1:0] a2, al, a0 ; // 输入 信和 号 
input [2:0] s ; // 独 热 选 择 信和 号 


output [k-1:0] b ; 

assign b = ({k{s[2]}} & a2) | 
({k{s[1]}} & al) | 
({k{s[0]}} & ao) ; 





endmodule 


图 8-11 任意 宽度 的 3 选 1 多 路 选择 器 的 Verilog 代码 
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为 了 将 选择 信号 如 s [0 ] ， 连 接 到 宽度 为 不 的 与 门 上 ， 必 须 复制 一 个 天 位 的 信号 ， 其 中 每 
一 位 均 为 s [0]。 这 可 以 通过 复制 运算 符 来 实现 。 在 Verilog 中 ,通过 {k{x}} 可 以 将 x 信号 复 
制 k 次 后 拼 成 一 个 首尾 相 接 的 信和 号。 因此， 在 这 个 模块 中 ， 如 果 希 望 将 选择 位 s [0] 重复 
次 ， 可 以 写作 {k{sL0]}}。 f 

3 选 1 多 路 选择 器 还 可 以 用 case 语句 描述 ， 如 图 8-12 所 示 。 本 段 代 码 与 图 8-11 等 效 ， 都 
是 s 为 独 热 码 信 号 的 情况 ， 但 更 易 阅 读 和 理解 。° 


// 任意 宽度 的 3 选 1 多 选择 器 ， 选 择 信 号 采用 独 热 编码 
module Mux3a(a2, al, a0, s, b) ; 
parameter k = 1 ; 
input [k-1:0] a0, al, a2 ; // 输入 信号 
input [2:0] s ; // 独 热 选择 信和 号 
output [k-1:0] B ; 
reg [k-1:0] b ; 


always @(*) begin 


case (s) 
3/001: b&b = ad ; 
3'b010: b = 
3°b100: b = 
default: b 

endcase 

end 
endmodule 





图 8-12 使 用 case 语句 实现 的 任意 宽度 的 3 选 1 多 路 选择 器 


大 多 数 标 准 单元 库 中 提供 的 多 路 选择 器 采用 的 是 独 热 编码 的 选择 信号 。 在 大 多 数 情况 下 , 
这 正 是 我 们 想 要 的 ， 因 为 我 们 的 选择 信号 已 经 是 独 热 码 的 形式 。 但 是 ， 在 某 些 情况 下 ， 我 们 希 
望 多 路 选择 器 提供 的 选择 信号 是 一 个 二 进 制 信号 。 这 可 能 是 因为 我 们 的 选择 信号 就 是 二 进 制 形 
式 而 不 是 独 热 码 形 式 ， 或 者 因为 选择 信号 要 传输 很 长 的 距离 或 通过 的 接口 位 宽 很 窗 ) ， 我 们 
希望 能 降低 布线 成 本 。 

图 8-13a 是 一 个 二 进 制 编码 的 多 路 选择 器 的 符号 。 该 电路 的 选择 端 吧 是 一 个 严 位 的 二 进 制 
fas, 其 中 m=[logsn 1， 根据 8 对 应 的 二 进 制 数 ， 选 取 nn 个 输入 端 中 的 一 路 信号 ， 例 如， 如 果 
sh=i, WA a, 被 选择 。 

我 们 还 可 以 通过 已 经 设计 好 的 两 个 模块 来 实现 一 个 二 进 制 多 路 选择 器 ， 如 图 8-13b 所 示 。 
首先 用 m-n 译 码 器 将 二 进 制 选择 信号 sb 转换 为 独 热 选择 信号 *， 然 后 再 通过 一 个 普通 的 多 路 
选择 器 〈 选 择 端 为 独 热 码 ) 选择 相应 的 输入 。 

图 8-14 为 Verilog 描述 的 位 3 选 1 二 进 制 多 路 选择 器 。 该 电路 功能 与 图 8-13b 完全 一 致 。 
2 -3 译 码 器 经 实例 化 后 ， 能 够 将 一 个 两 位 的 二 进 制 选择 信号 sb 转换 为 一 个 3 位 的 独 热 信号 s. 
该 信号 能 够 从 一 个 普通 的 (选择 端 为 独 热 信号 ) 3 选 1 多 路 选择 器 中 选择 需要 的 输入 信号 。 

图 8-15 为 4 选 1 二 进 制 多 路 选择 器 的 原理 图 。 译 码 器 输出 端的 每 一 个 2 输入 与 门 和 多 路 选 
择 器 输入 端的 2 输入 与 门 结合 ， 形 成 一 个 3 输入 与 门 。 这 种 结合 比 从 字面 上 理解 的 将 两 个 模块 


O ”两 种 描述 不 同 之 处 在 于 ， 当 选择 信号 s 为 非 独 热 信号 时 ， 例 如 s 为 全 零 或 不 止 一 位 为 1， 所 做 的 处 理 不 同 。 
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m =| log, n] 





a) 
图 8-13 二进制 多 路 选择 器 。a) k fii n ve 1 多 路 选择 器 选择 输入 端 w HP iA m 位 的 选择 
信号 sb 对 应 的 二 进 制 值 。b) 由 一 个 译 码 器 和 一 个 普通 〈 独 热 码 ) 的 多 路 选择 器 实 

现 二 进 制 多 路 选择 器 


// 任意 宽度 的 3 选 1 多 路 选择 器 ， 选 择 信号 采用 二 进 制 信号 
module Muxb3(a2, al, a0, sb, b) ; 
parameter k = 1 ; 
input [k-1:0] a0, al, a2; // 输入 信号 
input [1:0] sb ; // 二 进 制 编码 的 选择 信号 
output [k-1:0] b ; 


wire [2:0] 8 ; 


Dec #(2,3) d(sb,s) ; // 通过 译 码 器 将 二 进 制 信号 转换 为 独 热 信 号 
Mux3 #(k) m(a2, al, , s, i // 多 路 选择 器 选择 输入 


endmodule 





图 8-14 二 进 制 编码 的 3 选 1 多 路 选择 器 ， 该 多 路 选择 器 由 译 码 器 和 普通 多 路 选择 器 构成 


简单 地 组 合 在 一 起 更 高 效 。 图 8-14 用 Verilog 描述 了 两 个 模块 的 组 合 ， 这 种 结构 未 必 会 降低 电 
路 的 效率 。 良 好 的 综合 程序 会 根据 描述 生成 一 个 非常 有 效 的 门 级 电路 。 而 且 ， 采用 Verilog Hi 
述 的 目的 是 为 了 便于 阅读 、 维 护 及 综合 ， 优 化 工作 还 是 应 该 留 给 综合 工具 。 

图 8-16 中 的 Verilog 代码 采用 case 语句 实现 了 一 个 多 路 选择 器 ， 其 中 选择 信号 为 二 进 制 
编码 。 这 段 代码 采用 的 是 一 种 行为 描述 方式 ， 与 图 8-14 中 的 结构 化 描述 不 同 , 行为 描述 更 容 
易 阅 读 。 

当选 择 信号 本 身 就 是 独 热 编码 时 (例如 ， 仲 裁 器 用 
来 确定 哪 一 个 请 求 者 可 使 用 共享 资源 ) ， 如 果 使 用 的 是 
二 进 制 选择 多 路 选择 器 ， 此 时 有 可 能 会 出 现 一 个 常见 的 
设计 错误 。 很 多 设计 者 先 将 独 热 信 号 编码 为 二 进 制 信号 
( 见 8.4 节 )， 这 样 做 的 目的 只 是 为 了 译 码 时 能 够 生成 多 
路 选择 器 的 独 热 选 择 信号 。 这 里 进行 编码 和 译 码 其 实 毫 
无 必要 ， 不 仅 浪费 芯片 面积 、 消 耗 更 多 功率 ， 还 增加 了 
Verilog 描述 的 复杂 度 。 很 多 设计 人 员 过 度 使 用 二 进 制 选 
择 多 路 选择 器 ， 这 是 由 于 他 们 将 它 等 同 于 多 路 选择 器 。 
不 要 再 这 么 认为 了 ， 基 本 多 路 选择 器 的 数据 选择 端 是 独 
热 编码 的 。 如 果 需 要 处 理 一 个 独 热 编 码 的 选择 信号 ， 让 
它 保持 不 变 就 可 以 了 。 图 8-15 4 选 1 二进制 多 路 选择 器 原理 图 
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// 任意 宽度 的 3 选 1 多 路 选择 器 ， 选 择 信 号 采用 二 进 制 编码 
module Muxb3a(a2, al, a0, sb, b) ; 
parameter k = 1 ; 


input [k-1:0] a0, al, a2 ; // 输入 信和 号 
input [1:0] sb ; // 二 进 制 编码 的 选择 信号 
output [k-1:0] D ; 

veg [k-10] B ; 


always @(*) begin 
case (sb) 
Oz B að ; 
l: b at j 
2: b a2 ; 
default: b = {k{1i’bx}}; 
endcase 
end 


endmodule 





图 8-16 使 用 case 语句 描述 的 二 进 制 选择 多 路 选择 器 


我 们 可 以 把 儿 个 小 的 独 热 编码 多 路 选择 器 组 合 起 来 ， 在 它们 的 输出 端 接 一 个 或 门 就 可 以 实 
现 更 大 的 多 路 选择 器 。 大 的 独 热 编码 选择 向 量 被 分 给 几 个 小 的 多 路 选择 器 。 绝 大 多 数 多 路 选择 
器 的 选择 信号 为 全 零 ， 因 此 输出 为 零 。 只 有 独 热 信号 选中 的 多 路 选择 器 ， 所 选 的 那 路 输入 才 会 
被 输出 。 例 如 ， 图 8-17 给 出 了 一 个 6 选 1 的 多 路 选择 器 ,该 多 路 选择 器 由 两 个 3 选 1 多 路 选择 
器 构成 。 这 些小 的 多 路 选择 器 要 进行 或 运算 ， 因 此 任何 一 个 多 路 选择 器 的 选择 输入 端 为 全 零 ， 输 
出 必然 为 零 。 这 与 图 8-10b 中 的 三 态 多 路 选择 器 以 及 图 8-12 中 对 不 关心 的 情况 所 做 的 处 理 不 同 。 


module Mux6a(as, 
parameter k = 
input [k-1:0] a5, a4, š i š ; // 输入 信号 
input [5:0] s}; //” 独 热 选择 信号 
output [k-1:0] b ; 
wire [k-1:0] ha, 


assign b = ba | 


Mux3 #(k) ma(a2, 
Mux3 #(k) mb(a5, 


endmodule 
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大 型 二 进 制 选 择 多 路 选择 器 可 以 通过 树 形 结构 将 多 个 小 型 多 路 选择 器 组 合 起 来 ， 如 图 8-18 
所 示 。 图 中 实现 了 一 个 16 选 1 的 多 路 选择 器 ， 该 多 路 选择 器 由 5 个 4 选 1 多 路 选择 器 构成 。 在 
电路 的 前 端 设 置 4 个 4 选 1 多 路 选择 器 ， 它 们 的 选择 端 由 选择 信号 的 低 两 位 %:o 控 制 ， 分 别 从 4 
个 输入 端 中 选择 一 路 输出 ， 共 4 路 数据 。 这 4 路 数据 再 连接 一 个 4 选 1 多 路 选择 器 ， 选 择 端 由 
选择 信号 的 高 两 位 s.; 控 制 ， 从 中 选择 一 路 输出 。 例 如 ， 为 了 选择 all 端 ， 选 择 信号 为 1011, 
即 11 对 应 的 二 进 制 数 。 由 于 高 两 位 为 0， 选择 x2 作为 输入 ,该 路 信号 是 a8 到 all 这 组 信号 
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对 应 的 输出 。 而 低 两 位 为 11， 则 选择 all 作为 输出 。 与 图 8-17 采用 独 热 编码 的 多 路 选择 器 相 
比 ， 这 种 结构 的 多 路 选择 器 有 一 个 缺点 ， 就 是 选择 信号 中 最 低 有 效 位 改变 时 ， 即 使 只 需要 其 中 
一 个 信号 ，4 个 输出 信号 x 也 会 改变 ， 因 此 会 消耗 一 定 的 能 量 。 

通过 将 函数 的 真 值 表 作 为 多 路 选择 器 的 输入 ， 一 个 任意 的 输入 组 合 多 辑 函数 可 以 通过 二 进 
制 编码 的 2" 选 多 路 选择 器 实现 。 多 路 选择 器 的 选择 端 作为 逻辑 函数 的 输入 ， 用 来 选择 真 值 表 中 
对 应 的 表 项 。 图 8-19a 所 示 3 位 素数 判定 函数 就 是 采用 了 这 种 实现 方案 。 实 际 上 在 实现 任何 输 
入 的 逻辑 函数 时 ， 可 以 将 多 路 选择 器 分 解 为 最 高 位 输入 的 函数 ， 这 样 只 用 一 个 2" 输入 的 多 路 
选择 器 就 可 以 实现 ， 如 图 8-19b 所 示 。 图 中 将 真 值 表 按 b, =0 和 sb, =1 分 成 两 部 分 。 然 后 对 和 
余 选择 输入 sb,.。 各 组 合 对 应 的 真 值 表 进行 对 比 ， 如 果 两 部 分 的 真 值 表 为 0， 多 路 选择 器 对 应 的 
输入 端 为 0， 反 之 为 1。 当 sb, =0 时 ， 函 数值 为 0，sb。 =1 时 ， 函 数值 为 1， 多 路 选择 器 对 应 输 
入 端 为 sb,; "4 sby =0 时 ， 函 数值 为 1，sb, = 1 时 ， 函 数值 为 0， 多 路 选择 器 对 应 输入 端 为 85 。 






isprime 





图 8-18 由 小 型 二 进 制 选择 多 路 选择 器 构成 图 8-19 通过 二 进 制 选择 多 路 选择 器 可 以 直 
的 大 型 二 进 制 选择 多 路 选择 器 接 实现 组 合 逻 辑 函 数 。a) 利用 8 选 
1 多 路 选择 器 实现 3 位 素数 判定 函 
Bl. by 利用 4 选 1 二 进 制 编码 多 路 
选择 器 实现 相同 功能 
图 8-20 是 用 Verilog 描述 的 3 位 素数 判定 函数 ， 采 用 了 多 路 选择 器 实现 。 由 于 更 容易 编写 、 
阅读 和 维护 ， 图 中 选择 了 2" 输入 的 多 路 选择 器 ， 低 级 的 优化 可 留 给 综合 工具 。 


module Primem(in, isprime) ; 
input [2:0] in ; 
output isprime ; 


Muxb8 #(1) m(1, 0, 1, 0, 1, 1, 1, 0, in, isprime) ; 
endmodule 





图 8-20 利用 8 选 1 二 进 制 多 路 选择 器 实现 3 位 素数 判定 函数 的 Verilog 描述 ， 其 中 多 路 选择 
器 的 数据 输入 为 3 位 素数 的 真 值 表 
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8.4 编码 器 


图 8-21 为 编码 需 的 原理 图 符号 ， 该 逻辑 模块 能 够 将 输入 的 独 热 编码 信号 转换 成 二 进 制 编 
码 的 信号 输出 。 编 码 右 是 译 码 器 的 反 函 数 。 它 接受 一 个 位 独 热 的 信号 并 产生 m=[ logn | 位 的 
二 进 制 输出 信号 。 只 有 输入 信号 为 独 热 信号 时 ， 编 码 器 才能 正常 工作 。 

图 8-22 是 用 或 门 实现 的 4 -2 编码 器 。 每 一 个 或 门 的 输入 取 自 二 进 制 输出 集 所 对 应 的 独 热 
信号 。 例 如 ,图 8-22 中 2 和 3 的 二 进 制 编码 所 对 应 的 bl 输出 为 真 ， 因 此 b1 所 在 或 门 的 输入 包 
含 独 热 输入 a2 和 a3。 





m 
m= [logn] bo 


图 8-21 n-m i ARRERA S, ARA 图 8-22 4-2 编码 器 的 原理 图 
能 够 将 ”位 独 热 信 号 转变 为 到 =| logn] 
位 的 二 进 制 信号 
图 8-23 中 的 Verilog 模块 是 采用 逻辑 方程 描述 的 4 -2 编码 器 。 该 描述 与 图 8-22 中 的 原理 


图 一 致 。 将 b 中 两 位 信号 分 别 对 应 的 逻辑 表达 式 拼接 ， 就 可 以 实现 在 一 条 语句 中 对 输出 信号 b 
进行 赋值 。 


// 4-2 编 码 器 
module Enc42(a, b) ; 
input [3:0] a ; 


output [1:0] b ; 
assign b = {a[3] | a[2], a[3] | a[11) ; 
endmodule 


图 8-23 JH Verilog 描述 的 4 - 2 编码 器 


为 了 进行 比较 ,图 8-24 给 出 了 该 模块 的 Verilog 行为 描述 。 当 输入 为 独 热 码 时 ， 图 8-24 中 
的 模块 与 图 8-23 中 的 功能 相同 。 对 于 其 他 非 零 输 入 ， 行 为 模块 的 输出 为 一 个 无 关 项 或 未 知 状 
AS 〈x) ， 而 用 逻辑 表达 式 生 成 的 模块 的 输出 由 输入 位 经 或 运算 后 决定 。 编 写 代码 时 应 该 优先 
选择 行为 描述 方式 ， 这 样 既 可 以 检测 非法 输入 状态 ， 还 可 以 让 综合 器 自由 地 利用 无 关 项 从 而 使 
逻辑 达到 最 小 。 

图 8-24 中 的 编码 器 在 输入 为 全 0 时 输出 0。 这 种 小 型 编码 器 在 构建 大 型 编码 器 时 会 很 方 
便 。 如 果 不 需 要 这 个 功能 ， 可 以 从 case 语句 中 删除 这 一 行 代码 。 





// 4-2 编 码 器 
module Enc42b(a, b) ; 
input [3:0] a ; 


output [1:0] bD ; 
reg [2:0] b ; 





always @(*) begin 


图 8-24 4 -2 编码 器 的 Verilog 行为 描述 
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case (a) 
4'b0001: 
“b0010 : 
'bÞ0100: 
‘b1000: 
“b0000: 
default: 
endcase 


4 
4 
4 
4 


end 
endmodule 


图 8-24 (4) 


大 型 编码 器 可 以 由 几 个 小 型 编码 器 构成 ， 如 图 8-25 所 示 。 
图 中 实现 了 一 个 16 -4 的 编码 器 ， 该 编码 器 由 4 -2 编码 器 按照 
树 形 结构 组 成 的 。 为 了 实现 16 -4 编码 髓 ， 需 要 为 每 一 个 4 -2 
编码 器 增加 一 个 汇总 输出 端 。 只 要 编码 器 的 任何 一 个 输入 为 
真 ， 则 汇总 输出 为 真 。 编 码 器 输出 的 最 低 两 位 有 效 位 由 或 门 产 
生 2 ， 而 或 门 的 输入 直接 来 自 4 -2 编码 器 的 输出 。 这 里 需要 额 
外 增加 一 个 4 -2 编码 器 ， 它 的 输入 与 4 个 输入 编码 器 产生 的 汇 
总 输出 相连 ， 该 编码 器 的 输出 是 整个 16 -4 编码 器 的 最 高 两 位 
有 效 位 。 最 后 这 个 编码 器 的 汇总 输出 〈 图 中 未 显示 ) 可 以 作为 
整个 16 -4 编码 器 的 输出 。 更 大 型 的 编码 器 可 以 在 这 个 树 形 结 
构 上 继续 分 级 扩展 构成 。 

为 了 理解 树 形 编码 器 的 工作 原理 ， 我 们 以 a 为 例 ， 即 输入 
端 只 有 aio 为 真 ， 其 他 为 假 。 第 三 个 编码 器 (从 下 到 上 ) 的 输 
入 为 0100， 因 此 经 编码 后 输出 为 10， 它 的 汇总 输出 为 真 。 其 他 
输入 编码 器 的 输入 均 为 0， 因 此 输出 全 部 为 0。 第 三 个 编码 器 的 
输出 传递 到 两 个 或 门 ， 与 其 他 输入 〈 此 时 均 为 0) 经 或 运算 后 
形成 最 低 两 位 有 效 位 ， 即 5b,.。= 10。 由 于 仅 第 三 个 编码 器 的 汇 





i // 用 于 扩展 大 的 编码 器 





图 8-25 ”大 型 编码 器 可 以 由 小 型 
编码 器 构成 。 每 一 个 小 
型 编码 器 需要 添加 一 个 
额外 的 输出 ， 用 来 表明 
其 输入 是 否 为 真 


总 输出 为 真 ， 使 得 用 来 产生 高 位 的 编码 器 的 输入 为 0100， 经 编码 后 输出 b = 10， 因 此 整个 纺 
码 器 的 输出 b. = 1010， 其 所 对 应 的 十 进 制 数 为 10 ， 即 实现 对 a 的 编码 。 

图 8-26 为 该 树 形 编码 器 的 Verilog 描述 。 模 块 Enc42a 实现 带 汇总 输出 的 4 -2 编码 器 ， 该 
模块 中 产生 汇总 输出 c 的 语句 使 用 了 Verilog 中 的 缩减 运算 符 。 表 达 式 la 将 a 的 所 有 位 逐次 进 


行 或 运算 。 同 理 ，&a 将 a 的 所 有 位 逐次 进行 与 运算 。 


// 4-2 编 码 器 一 一 带 汇 总 输出 


module Enc42a(a, b, c) ; 


input [3:0] a ; 
output [1:0] b ; 





output c ; 


图 8-26 Verilog 描述 的 16 -4 编码 器 ， 该 编码 器 由 一 组 带 汇总 输出 的 4-2 编码 器 〈Enc42a 
模块 ) 构成 。Enc42a 模块 有 一 个 输入 为 真 ， 汇 总 输出 为 真 





O ”这 就 是 为 什么 在 图 8-24 中 当 输 入 为 4'h0 时 ， 输 出 是 2'b00， 而 不 是 2 'bxx。 
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assign b = {a[3] | a[2], a[3] | a[1]) ; 
assign = |ë ç 


endmodule 


module Encl64(a, b) ; 
input [15:0] a ; 
output [3:0] b ; 
wire [7:0] c ; // 第 一 级 的 中 间 结 果 
wire [3:0] d ; // 判断 4 组 中 是 否 存 在 置 位 


// 4 个 用 来 产生 低位 的 编码 器 

Enc42a e0(a[3:0], c[1:0],da[0]) ; 
Enc42a el(al7:4], c[3:2],d[1]) ; 
Enc42a e2(a[11:8], c[5:4],d[2]) ; 
Enc42a e3(a[15:12],c[7:6],da[3]) ; 


// 该 编码 器 根据 汇总 值 形成 编码 的 高 位 
Enc42 e4(d[3:0], b[3:2]) ; 


// 4 个 低位 编码 器 产生 的 输出 经 过 两 个 或 门 后 形成 编码 的 低位 
assign b[1] c[1])|c[3]|c[5)|c[7] ; 
assign b[0] c[o]|ce[2]|ce[4]|e [6] ; 

endmodule 





图 8-26 (4) 


例 8-2 温度 计 编 码 器 
用 Verilog 编写 一 个 能 够 将 4 位 温度 编码 转换 为 二 进 制 数 的 编码 器 ， 其 中 二 进 制 数 反映 了 
温度 编码 中 1 的 个 数 。 如 果 输 入 不 是 温度 编码 ， 输 出 为 X。 具 体 代码 如 图 8-27 所 示 。 


module ThermometerEncoder(a,b) ; 
input [3:0] a; // 温度 计 编 码 器 输入 
output [2:0] b ; // 输入 中 1 的 个 数 一 一 如 果 合 法 


reg [2:0] b ; 


always @(*) begin 
case (a) 
4'b0000: 
4'b0001: 
4'b0011: 
4'b0111: 
4’b1111: 
default: 
endcase// (a) 
end 





endmodule //ThermometerEncoder 


图 8-27 用 Verilog 描述 的 能 够 将 4 位 温度 编码 转换 为 二 进 制 数 的 编码 器 
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8.5 ”仲裁 器 和 优先 编码 器 





图 8-28 为 仲裁 器 的 原理 图 符号 ， 有 时 又 被 称 为 寻找 第 一 个 1 " 
(FFL) 单元 。 该 电路 接收 一 个 任意 的 输入 信号 ， 并 输出 一 个 独 res = 
热 信号 ， 该 独 热 信号 中 唯一 的 1 所 在 的 位 置 与 输入 信号 中 1 的 最 
低 有 效 位 相同 。 例 如 ， 如 果 一 个 8 位 仲裁 器 的 输入 为 01011100， 图 8-28 仲裁 器 的 原理 图 符号 
由 于 最 低位 1 所 在 位 为 第 2 位 ， 所 以 输出 为 00000100。 在 某 些 应 
用 中 ， 我 们 还 可 以 逆向 使 用 仲裁 器 ， 寻 找 1 所 在 的 最 高 有 效 位 。 在 本 节 中 ， 我们 主要 关注 如 何 


利用 仲裁 器 在 输入 信号 中 找到 1 所 在 的 最 低 有 效 位 。 

在 数字 系统 中 ,仲裁 器 用 来 仲裁 对 共享 资源 的 
WR. GAN, WR n 个 单元 共享 一 条 总 线 ， 同 一 时 
间 只 允许 一 个 单元 占用 该 总 线 ， 那 么 一 个 n 输入 的 
仲裁 器 可 以 决定 在 给 定 的 周期 内 各 单元 何 时 使 用 总 
Be ( 见 24.2 节 )。 仲裁 器 的 另 一 个 用 途 是 在 算术 运 
算 电 路 中 对 数字 进行 格式 化 时 寻找 最 高 有 效 1 的 位 置 
( 见 11.3.3 节 )。 在 该 应 用 中 ,它们 被 称 为 寻找 第 一 个 
1 单元 ， 由 于 没有 仲裁 器 ， 需 要 通过 移动 来 找到 最 高 
有 效 的 1 (可 与 我 们 现在 讨论 的 仲裁 器 进行 对 比 ) o 

仲裁 器 可 以 构建 成 一 个 选 代 电路 。 也 就 是 说 ， 
设计 仲裁 器 时 先 设计 一 位 逻辑 电路 ， 然 后 再 重复 使 
用 该 电路 (或 进行 迭代 )。 图 8-29 给 出 了 仲裁 器 中 
一 位 (第 i 位 ) 的 逻辑 。 用 一 个 与 门 来 产生 该 位 能 
否 输 出 的 信号 g;。 如 果 请 求 信号 r 为 高 ， 且 当前 未 
找到 1 ，g; 为 高 ， 就 像 图 中 上 面 那个 输入 端 发 出 1 一 
样 。 如 果 当 前 阶段 或 之 前 任意 阶段 未 找到 1， 另 一 个 
与 门 会 向 下 游 发 出 信号 。 在 学 习 数 字 设 计时 我 们 会 看 
到 很 多 类 似 的 迭代 电路 ， 这 些 电 路 广泛 应 用 在 算术 电 
路 中 〈 见 第 10 章 ) 。 

例如 ， 构 建 一 个 4 位 仲裁 器 ,我 们 可 以 将 图 8-29 
中 的 位 单元 复制 4 份 并 连接 ， 其 中 第 一 个 单元 上 面 的 
输入 端 与 相连 ， 所 得 电路 如 图 8-30a 所 示 。 由 若干 
与 门 形成 的 垂直 链 会 扫描 输入 请 求 ， 直 到 发 现 第 一 个 
1 为 止 ， 并 且 会 禁用 该 输入 后 面 的 所 有 输出 。 用 于 输 
出 的 与 门将 第 一 个 输入 的 1 传递 到 输出 ， 并 且 将 该 1 
所 在 位 后 面 的 输出 强制 设 为 0。 

该 电路 中 与 门 形成 的 线性 链 路 会 造成 一 定 的 延 
迟 ， 该 延迟 会 随 着 输入 数 的 增加 而 线性 增加 。 在 某 些 
应 用 中 这 个 延迟 会 很 高 。 我 们 可 以 将 逻辑 扁平 化 来 缩 
短 这 个 延迟 ， 如 图 8-30b 中 所 示 。 这 项 技术 经 常 被 称 
作 超 前 技术 ， 因 为 产生 g3 输出 的 门 会 根据 ro. ri 


O 在 该 应 用 中 ， 为 了 实现 资源 共享 ， 我 们 使 用 典型 的 循环 优先 仲裁 器 。 


相连 的 单元 处 于 不 公平 的 地 位 。 


yet,_; 


v 
£ 
© 
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Z 





图 8-29 


图 8-30 





一 位 仲裁 器 逻辑 图 。 只 有 当 输 入 为 
1 且 当 前 仍 未 找到 1 时 输出 为 真 。 
如 果 之 前 已 经 找到 1， 或 当前 输入 
正好 为 1， 和 输出 信号 通知 其 他 阶段 
已 经 找到 一 个 1 


a) b) 


4 位 仲裁 器 的 两 种 实现 方式 。a) 
使 用 图 8-29 中 的 位 单元 电路 ; b) 
使 用 超前 技术 


在 固定 优先 级 仲裁 器 中 ， 与 最 低 优先 级 
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Al r2 的 值 提前 获得 ， 而 不 是 等 它们 经 过 一 串门 电路 后 再 去 判断 。 在 12. 1 节 ， 我 们 将 看 到 有 关 
超前 技术 在 迭代 电路 上 更 具 扩 展 性 的 实现 方法 。 

图 8-31 中 给 出 了 仲裁 器 的 两 种 Verilog 描述 。 仲 裁 器 Arb 用 来 寻找 1 的 最 低 有 效 位 ， 仲 裁 
fr RArb 寻找 1 的 最 高 有 效 位 。 其 中 arb 的 实现 方法 与 图 8-30a 完全 一 致 。 信 号 c 和 请 求 输入 
r 进行 与 运算 后 形成 信号 g， 其 中 信号 c 表示 目前 为 止 还 未 找到 1， 该 信号 通过 拼接 方式 将 若 
干 信号 拼接 起 来 ， 其 中 LSB 设置 为 1 ( 即 g0 始终 有 效 ) ， 剩 余 所 有 位 c[ i ] 设 置 为 x[i -1]gc 
[i -1]。 乍 一 看 ,该 定义 像 是 一 个 环形 电路 ， 因 为 看 起 来 好 像 我 们 用 c 来 代表 环形 。 但 仔细 
检查 后 我 们 应 该 能 够 意识 到 c 的 每 一 位 只 依赖 于 c 的 低 有 效 位 ， 因 此 该 定义 不 是 环形 的 。 


// 仲裁 器 (任意 宽度 ) 一 一 LSB 的 优先 级 最 高 
module Arb(r, g) ; 


parameter n=8 ; 
input ([n-1:0] 
output [n-1:0] 
wire [n-1:0] 
assign g = r & 
endmodule 


// 仲裁 器 ( 任意 宽度 ) 一 一 MSB 的 优先 级 最 高 
module RArb(r, g) ; 
parameter n=8 ; 


input [n-1:0] r ; 
output [n-1:0] g ; 





wire [In-1:0] c = {1'b1, (~r[m-1:1] & c[n-1:1])} ; 
assigng=ré&cj; 
endmodule 
图 8-31 两 个 任意 宽度 的 固定 优先 级 仲裁 器 的 Verilog 描述 。Arb 找到 最 低 有 效 的 1，RArb 
找到 最 高 有 效 的 1 


为 了 进行 比较 ,图 8-32 给 出 了 一 个 用 行为 方式 描述 的 4 位 仲裁 器 的 Verilog 代码 ， 该 代码 
实现 了 从 输入 a 中 查找 1 的 最 低 有 效 位 的 功能 。 代 码 通过 casex 语句 将 16 行 的 真 值 表 压缩 为 
5 行 ， 其 中 默认 情况 永远 不 会 出 现 。 

仲裁 器 的 一 个 用 途 是 构建 优先 编码 器 ， 如 图 8-33 所 示 。 优 先 编码 器 有 一 个 n 位 的 输入 信 
号 a 和 一 个 m =| logiz] 位 的 二 进 制 输出 信号 b，Pb 指出 了 a 中 第 一 个 1 的 位 置 。 优 先 编码 器 有 
两 个 工作 步 又 ， 如 图 8-33a 所 示 。 首 先 ， 仲 裁 器 找到 输入 a 中 第 一 个 1 的 位 置 ， 输 出 一 个 只 有 
该 位 为 1 的 独 热 码 信号 g。 然 后 ， 通 过 一 个 编码 器 将 独 热 码 g 转换 为 二 进 制 信号 bo E 8-34 
中 给 出 了 优先 编码 器 的 Verilog 描述 。 

当 输 入 a 为 0 时， 仲裁 器 输出 g =0， 该 信号 不 是 独 热 码 。 如 果 本 例 中 的 编码 器 是 按 8.4 
节 中 所 描述 那样 用 或 门 电路 搭建 而 成 的 ， 将 会 输出 b =0， 在 多 数 情况 下 这 是 可 以 接受 的 。 但 
在 某 些 应 用 中 ， 必 须 能 够 检测 全 零 的 情况 ， 并 输出 一 个 特殊 的 码 来 区 别 输入 为 0 还 是 第 一 位 为 
0。 这 很 容易 实现 ， 只 需 在 设置 仲裁 器 的 宽度 时 比 其 他 情况 宽 1 位 ， 且 将 最 后 输入 位 设置 为 常 
数 1。 

优先 编码 器 的 Verilog 行为 描述 如 图 8-35 所 示 。 该 电路 在 输入 r =0 的 情况 下 输出 为 x， 而 
不 是 0。 当 上 =0 BF, 该 电路 很 容易 修正 ， 通 过 在 casex 语句 添加 一 行 就 可 以 给 g (或 者 作为 
辅助 输出 ) 分 配 任 何 值 。 
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// 宽度 为 4 位 的 仲裁 器 一 一 LSB 的 优先 级 最 高 
module Arb 4b(r, g) 
input [3:0] r ; 


output [3:0] g ; 
reg [3:0] g ; 
always @(*) begin 





casex (r) 
4'b0000: 4’'b0000 ; 
4'bxxx1: 4'b0001 ; 
4'bxx10: 4'b0010 ; 
4'bx100: 4'b0100 ; 
4'b1000: 4’b1000 ; 
default: 4'hx ; 
endcase 
end 
endmodule b) 
图 8-32 通过 casex 语句 查找 1 的 最 低 有 ”图 8-33 a) 将 仲裁 器 和 编码 器 连接 在 一 起 实现 的 优 
效 位 的 4 位 仲裁 器 的 行为 描述 先 编码 器 。b) 优先 编码 器 的 原理 图 符号 


// 8-3 优 先 编码 器 

module PriorityEncoder83b(r, b) ; 
input [7:0] r ; 
output [2:0] b ; 
reg [7:0] g ; 


always @(*) begin 
casex (r) 
4'Dxxxxxxx1: 
4’ Dxxxxxx10: 
4‘ bxxxxx100: 
// 8-3 优 先 编 码 器 4'bxxxx1000: 


module PriorityEncoder83(r, b) ; Og: 
4’bxx100000: 


4’bx1000000: 
4'b10000000: 
default: 


input [7:0] E š 
output [2:0] b ; 
wire [7:0] g ; 
Arb #(8) a(r, g) ; 
Enc83 e(g, b) ; end 
endmodule endmodule 


0; 
1; 
2; 
3 ç 
#@ g 
É < 
6 ; 
ne 


endcase 





图 8-34 ”优先 编码 器 的 Verilog 描述 图 8-35 ”优先 编码 器 的 Verilog 行为 描述 


例 8-3 可 编程 优先 级 仲裁 器 

使 用 位 片 式 标记 法 ， 用 Verilog 编写 一 个 优先 级 可 编程 的 仲裁 器 。 要 求 该 仲裁 器 能 够 接受 
一 个 用 独 热 码 表示 的 优先 级 信号 P， 该 信号 用 来 选择 工 中 拥有 最 高 权限 的 那 一 位 。 优 先 级 从 该 
位 起 向 左 依 次 减少 ， 范 围 涉及 -1 位 到 0 位。 例如， 对 于 8 位 仲裁 器 ， 如 果 p 的 第 6 位 被 设 
Z, RZ r [6] 拥有 最 高 优先 级 ， 上 [7] 拥有 第 二 高 的 优先 级 ，r [0] 拥有 第 三 高 的 优先 
级 ， 以 此 类 推 。 为 了 便于 时 序 验 证 ,设计 中 不 应 包含 循环 逻辑 。 
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为 了 实现 所 需要 功能 ， 可 以 在 循环 逻辑 中 使 用 下 面 两 个 语句 来 实现 。 


wire [n-1:0] c = ({~r[n-2:0],~r{[n-1]} & {c[n-2:0],c[n-1]}) | p ; 
assigng=ré&cj; 


第 一 行 语句 从 信号 p 所 指定 的 位 为 “1” 的 位 置 开始 ， 计 算 每 一 位 的 进位 信号 ec， 只 要 信 
号 对 应 位 为 低 就 向 左 循环 传递 该 进位 ， 就 可 以 找到 优先 级 最 高 的 请 求 。 遗 憾 的 是 ， 由 于 该 过 
辑 是 循环 的 ， 无 法 用 现代 的 时 序 验证 工具 进行 验证 。 

为 了 使 逻辑 无 环 ， 可 以 复制 进位 链 ,， 使 其 长 度 为 2n， 这样 传播 [n -1] 位 的 进位 就 不 用 
Mi REET o 


wire [2*n-1:0] c = ({~r[n-2:0],7r,~r[n-1]} & 
(c[2*n-2:0],1'b0)) | {{n{1'bo}},p} ; 
assign g = r & (c[2*n-1:n) | c[n-1:0]) ; 
8.6 比较 器 


图 8-36 给 出 了 等 值 比较 器 的 原理 图 符号 。 该 模块 输入 端 为 两 个 位 的 二 进 制 信号 a 和 b, 
输出 端 是 一 个 1 位 的 信号 ， 该 信号 用 来 指示 是 否 =); 也 就 是 说 ，a 的 每 一 位 与 5 所 对 应 的 每 
一 位 是 否 相 等 。 

图 8-37 给 出 了 4 位 等 值 比较 器 的 逻辑 图 。 图 中 专用 的 一 组 或 非 〈 蜡 或 非 ) 门 用 来 比较 输 
入 信号 的 每 一 位 。 如 果 两 个 输入 信号 相等 ， 每 个 异 或 非 门 的 输出 都 为 高 ， 所 以 当 双 = 上 天 时 ， 信 
号 eqi 为 真 。 最 后 所 有 eqi 信号 通过 一 个 与 门 ， 只 有 当 所 有 位 都 相等 时 输出 才 为 真 。 此 外 ， 设 
计 等 值 比较 器 时 还 可 以 通过 迭代 电路 对 每 一 位 进行 线性 扫描 来 确定 所 有 位 是 否 都 相等 。 


a3 








路 
& 
X eq 
gm 
n b E 
图 8-36 等 值 比较 器 的 原理 图 符号 。 图 8-37 4 位 等 值 比较 器 的 逻辑 图 。 专 用 的 或 非 
如 果 a=b, eq 的 输出 为 真 ( 异 或 非 ) 门 用 来 比较 输入 信号 8 b ñ 
每 一 位 。 逐 位 比较 后 的 信号 通过 右 端的 
与 门 ， 如 果 比 较 的 结果 相等 ， 输 出 为 真 
图 8-38 中 给 出 了 等 值 比较 器 的 Verilog 描述 。 这 里 我 们 使 用 Verilog 的 “= =” 运 算 符 直接 
产生 相等 的 输出 信号 eq. FAK, Verilog 中 产生 不 相等 的 输出 需要 使 用 “! =” 运 算 符 。 男 一 
种 实现 方式 是 通过 XNOR 运算 符 “ — ”进行 按 位 比较 ， 如 下 所 示 : 
wire eq = &(a ~^ b) ; 


这 里 无 须 声明 中 间 信 号 ， 就 可 以 使 用 AND 缩减 运算 符 对 每 一 位 进行 异 或 非 运算 。 

数值 比较 器 可 以 用 来 比较 两 个 二 进 制 数 的 相对 大 小 。 严 格 来 讲 ， 这 是 一 个 运算 电路 ， 它 将 
输入 看 作 数 字 ， 因 此 我 们 将 其 放 在 第 10 章 里 进行 介绍 。 这 里 提 及 是 因为 该 模块 是 理解 迭代 电 
路 的 一 个 很 好 的 例子 。 

图 8-39 为 数值 比较 器 的 原理 图 符号 。a Mb BA ni, MR 比 b 大 ,输出 信号 g 为 真 。 
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两 个 二 进 制 数 不 相等 时 ， 如 果 其 中 一 个 最 高 有 效 的 位 为 1， 该 数 比 另 一 个 大 。 


// 等 值 比较 器 
module EqComp (a, 


parameter k=8 ; 


input [k-1:0] a, i a 





= 路 
output eg ; = 
assiqn š gt 
endmodule |b 3 
图 8-38 利用 Verilog 中 的 “= =” 运 算 符 实 图 8-39 数值 比较 器 的 原理 图 符号 。 
现 的 等 值 比较 器 MRa>b, gt 的 输出 为 真 


8-40 中 的 数值 比较 器 是 由 两 个 不 同 的 迭代 电路 构建 而 成 的 。 当 两 个 数字 不 相等 时 ， 
图 8-40a 中 的 电路 是 从 LSB 向 MSB 扫描 查找 最 高 有 效 位 。 该 电路 传递 的 信号 为 gb (低位 大 ) 。 
如 果 信 号 eth, RH, KHAS a 从 LSB 一 直到 i -1 位 均 大 于 信号 5， 即 gtb, 代表 a,_1,。 > 4b,_1,06 
WR a, >b, RA a =b H co > birot, gb ,被 置 位 。 最 高 有 效 位 发 出 的 信号 eth, 将 给 出 最 
后 结果 ， 因 为 该 信号 表示 a 1.9 > os 图 8-41 是 LSB 优先 数值 比较 器 的 Verilog 描述 。 





图 8-40 ”数值 比较 器 的 两 种 迭代 实现 方法 。a) 先 处 理 LSB; 低位 大 信号 gtb 向 上 传播 。b) 先 
171 处 理 MSB， 高 位 大 信号 gta 和 高 位 相等 信号 eqa 向 下 传播 


module MagComp(a, b, gt) ; 
parameter k=8 ; 
input [k-1:0] a, b ; 
output gt ; 


wire [k-1:0] eqi = a “^b; 

= & & “bh ; 
wire [k:0] gtb = (((eqi[k-1:0]&gtb[k-1:0])|gti[k-1:0]),1'b0) ; 
assign gt = gtb[k] ; 


wire [k-1:0] gti 


endmodule 





图 8-41 LSB 优先 数值 比较 器 的 Verilog 描述 


图 8-40b 中 的 数值 比较 器 采用 了 另 一 种 迭代 方式 ， 即 MSB 优先 。 采 用 这 种 方式 时 ， 每 位 之 
间 必 须 传 递 两 个 信号 。 信 号 gta (高 位 大 ) 表示 比 当前 位 高 的 位 满足 a >0， 换 名 话说， 就 是 
Gop-iaifi 之 Diesen 同 理 ， eqa; (高 位 相等 ) 表示 | = 8. Sree 这 两 个 信号 都 是 从 MSB 向 
LSB 逐 位 扫描 。 一 旦 发 现 有 差别 ， 就 可 以 获得 比较 结果 。 如 果 第 一 个 差异 出 现时 a>b， 电 路 中 
差异 位 发 出 的 gta;_, 信 号 被 置 位 、eqa;_, 信 号 被 清 零 ( 原 书 有 误 一 一 译 者 注 ) ， 这 些 值 一 直 被 传 


PSE APCEBRAFL 123 








播 到 输出 。 相 反 ， 如 果 第 一 个 差异 位 出 现时 b>a，eqa,_, 被 清 零 ， 但 gta, ,保持 低 电 平 。 这 些 信 
号 也 是 一 路 传 至 到 输出 。 输 出 为 gta_, 信 号 。 
图 8-42 给 出 了 数值 比较 器 的 Verilog 行为 描述 。 该 模 | // 数值 比较 器 的 行为 描述 
块 比 图 8-41 中 的 模块 更 容易 理解 。 这 段 代码 在 大 多 数 综 | "p g Be Se) 
合 器 中 都 可 以 生成 非常 好 的 逻辑 ， 为 满足 规定 的 时 序 约束 oe heiir w; tea 
综合 器 会 使 用 超前 技术 。 图 8-38 中 的 等 值 比较 器 采用 的 output gt ; 
是 行为 描述 方式 。 assign gt = (a > b) ; 
例 8-4 三 路 等 值 比较 器 endmodule 
用 Verilog 描述 一 个 三 路 等 值 比较 器 ， 即 当 三 个 输入 图 8-42 数值 比较 器 的 Verilog 行为 描述 
a, b, c 彼此 相等 时 输出 为 真 。 
下 面 给 出 该 模块 的 Verilog 代码 ， 它 能 够 比较 两 对 输入 。 
assign eq3 = (a == b) & (b == c) ; 


8.7 移 位 器 


移 位 器 是 一 个 组 合 迎 辑 电路 ， 该 模块 输入 端 包 含 位 字段 a 和 移动 位 数 n， 输出 信号 为 b。 
其 中 b =a< <n， 即 a 移动 n 个 位 置 。 左 移 移 位 器 向 左 移 位 ， 右 移 移 位 器 向 右 移动 ， 桶 形 移 位 
器 对 输入 a 进行 循环 移动 (移出 的 位 会 出 现在 右边 (或 左边 ) 起 始 位 置 ) ， 漏 斗 移 位 器 的 功能 
是 从 一 个 大 字段 的 指定 位 置 中 选择 一 个 小 字段 。 

图 8-43 给 出 了 左 移 移 位 器 的 Verilog 代码 。 该 module ShiftLeft(n, a, b) ; 
模块 默认 参数 是 接收 8 位 的 输入 a 和 三 位 的 移动 Parameter Neate. 

位 数 n， 然后 产生 15 位 的 输出 bp。 当 移动 位 数 n parameter 1k=3 ; 

为 最 大 值 7 时 ， 输 入 的 位 域 在 输出 b 中 是 左 对 齐 input [1k-1:0] n ; // 移动 几 位 
的 。 当 移动 位 数 为 最 小 值 时 ， 输 入 的 位 域 在 输出 input [k-1:0] a; // 待 移动 的 数 
b 中 是 右 对 齐 的 。 output [2*k-2:0] b; // 输出 

图 8-44 给 出 了 桶 形 移 位 器 的 Verilog 代码 。 该 assign b = agen i 
模块 将 a 左 移 后 形成 信号 x， 然 后 将 x 的 高 位 与 x Lendmodute 
的 低位 进行 或 操作 ， 即 将 x SARA bo 图 8-43” 左 移 移 位 器 的 Verilog 描述 

有 关 漏 斗 移 位 器 的 描述 留 作 习题 8-17。 


module BarrelShift(n, a, b) ; 
parameter k=8 ; 








parameter lk=3 ; 
input [1k-1:0] n ; // 移动 几 位 


input [k-1:0] a; // 待 移动 的 数 


output [k-1:0] b ; // 输出 
wire [2*k-2:0] x = a<<n ; // RHE 


assign b = x[k-1:0] | {1'b0,x[2*k-2:k]} ; 





endmodule 


图 8-44 桶 形 移 位 器 的 Verilog 描述 


8.8 只 读 存 储 器 


只 读 存 储 器 ， 或 者 ROM， 其 内 部 是 一 种 查找 表 的 结构 。 它 可 以 接受 一 个 地 址 作为 输入 ， 
然后 输出 该 地 址 中 所 存储 的 值 。 由 于 表 中 所 存储 的 值 是 预先 确定 ， 所 以 ROM 是 只 读 的 。ROM 
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在 制造 时 采用 的 是 硬 连 线 方式 且 不 能 被 更 改 。 在 8.9 节 我 们 会 介绍 读 写 存储 器 ， 该 存储 器 中 的 
内 容 可 以 修改 。 第 25 章 将 从 系统 的 角度 讨论 存储 器 。 

图 8-45 为 ROM 的 原理 图 符号 。 该 ROM 字数 为 N、 字 长 为 a 
5， 地 址 a 的 宽度 为 n 位 (n=[log,N] ) 。 当 接收 到 地 址 信号 a, A b 
从 ROM 中 选择 一 个 字 并 从 4 端 输 出 ， 该 字 宽 度 为 5 位 。 

将 函数 的 真 值 表 存储 到 ROM 中 还 可 以 实现 任意 逻辑 函数 。 图 8-45 ROM 原理 图 符号 。a 的 
例如 ， 我 们 可 以 用 一 个 字数 为 10、 字 长 为 7 的 ROM 实现 一 个 pnt dm eestor 
七 段 译 码 器 。 数 字 0 对 应 的 段 模式 1111110 放 在 第 一 个 位 置 fl Ngai 
(地 址 0)，1 对 应 的 段 模 式 0110000 放 在 第 二 个 位 置 (地 址 i 
1), ， 以 此 类 推 。 

图 8-46 中 的 ROM 是 采用 译 码 器 和 三 态 缓冲 器 实现 的 。 
其 中 由- N 的 译 码 器 将 一 个 位 二 进 制 地 址 译 码 成 一 个 N 位 
的 独 热 码 选择 信号 w。 该 字 节 用 来 选择 与 每 一 位 相连 的 三 态 
门 。 当 地 址 a =; 发 送 到 ROM 的 地 址 端 时 ， 字 节选 择 信号 wo, 
变 为 高 电 平 ， 对 应 的 三 态 缓冲 器 打开 并 将 相应 的 表 项 d, 输出 。 

对 于 容量 较 大 的 ROM， 如 采用 图 8-46 中 的 一 维 ROM 结构 
会 使 器 件 变 得 繁重 且 效 率 低下 。 由 于 需要 N 个 与 门 ， 译 码 器 的 
结构 会 变 得 非常 庞大 。 当 ROM 超过 一 定 规模 时 ， 采 用 图 8-47 
中 所 示 的 二 维 存储 阵列 结构 效率 会 更 高 。 图 中 8 位 地 址 a, ,被 
分 成 了 一 个 6 位 的 行 地 址 a;., 和 一 个 2 位 的 列 地 址 as。 行 地 
址 被 输入 到 译 码 器 中 ， 并 通过 一 个 64 位 的 独 热 码 选择 信号 w 图 8-46 ROM 可 以 由 一 个 译 码 器 





来 选择 其 中 的 一 行 。 列 地 址 被 送 入 一 个 二 进 制 多 路 选择 器 中 ， 和 一 组 三 态 门 实现 ,三 
并 从 选择 的 行 中 选 出 需要 的 字 。 例如， 地 址 a =49 =110001, 态 门 的 输入 端 为 常数 。 
那么 行 地 址 是 1100 = 12， 列 地 址 就 是 01。 因 此 选择 线 wi 为 地 址 经 过 译 码 后 选择 其 
高 ， 选 择 包含 ds 到 d 的 这 一 行 ， 然 后 通过 多 路 选择 器 选择 该 中 一 个 三 态 门 ， 访 门将 
行 中 的 第 二 个 字 doo enn 







256 个 字 x 
16 位 / 字 ROM 
644T x 64 列 


图 8-47 采用 二 维 结构 实现 的 ROM。 译 码 器 选择 一 行 字 ， 多 路 选择 器 从 选择 的 行 中 选 出 需要 的 列 
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尽管 图 8-47 中 ROM 的 地 址 没有 均 分 ， 但 其 阵列 结构 呈正 方形 。 该 器 件 共 有 64 行 ， 每 一 
ITA 64 位 ; 每 一 行 4 个 字 ， 每 字 16 位 。 正 方形 阵列 往往 会 使 内 存 布 局 最 有 效 ， 因 为 它 可 以 最 
大 限度 地 减少 外 围 设备 ( 译 码 器 和 多 路 选择 器 ) 的 开销 。 更 大 的 ROM (超过 10 ~10' fz) 则 
可 以 通过 位 片 或 存储 体 的 形式 将 多 个 存储 器 组 合 而 成 ， 如 25. 2 节 中 描述 的 。 

在 实际 电路 中 ，ROM 采用 高 度 优化 的 电路 。 为 了 清晰 起 见 ， 我 们 用 传统 的 逻辑 符号 来 表 
示 只 读 存 储 右 一 一 每 个 位 置 有 一 个 三 态 缓冲 器 。 事 实 上 ， 大 多 数 的 ROM 存储 每 位 信息 时 仅 需 
要 一 个 晶体 管 (或 者 不 存在 ) 电路 就 可 以 了 。 

在 Verilog 中 可 以 使 用 case 语句 将 ROM 模块 化 ， 如 图 8-48 所 示 。 该 模块 在 实例 化 时 ， 要 么 
被 综合 成 实现 ROM 功能 的 逻辑 门 ， 或 者 被 一 个 硬 布线 的 ROM 模块 替换 。ROM 中 存储 的 内 容 不 
同 ， 综 合 后 的 逻辑 就 会 有 不 同 的 面积 、 延 迟 和 功 耗 。 这 非常 不 利于 在 设计 后 期 修改 ROM 数据 。 
而 且 ， 随 着 ROM 的 增 大 ，case 语句 的 规模 也 在 增 大 ， 设 计 者 出 错 的 概率 也 会 增 大 。 

还 可 以 使 用 另 一 种 方式 来 实现 ROM， 如 图 8-49 所 示 。 该 模块 是 通过 $ readmemh 语句 将 
数据 加 载 到 一 组 reg 变量 中 来 实现 的 。 


// 用 case 语 名 实现 的 ROM ( 固定 宽度 ) 
module rom_case (a, d) ; 
input [3:0] a; 
output [7:0] d; 
reg [7:0] 4d; 
always@(*) begin 
case (a) 
4'h0: d=8'h00; 
Athi: d=8”hll; 
4'h2: d=8'h22; 
4R3: d=8'h33,; 
4’h4: d=8'h44; 
4'h5: d=8'h12; 
4'h6: d=8'h34; 
4'h7: d=8'hS6; // 任意 宽度 和 长 度 的 ROM 
4'h8: d=8'h78; module rom_reg (a, d) ; 
4'h9: d=8'h9a; parameter b = 32; 
4'ha: d=8'hbc; parameter w = 4; 


4'hb: d=8'hde; parameter fileName = "dataFile"; 
4'"he: d=8"h£o; input [w-1:0] a; 
4'hd: d=8'h12; output [b-1:0] d; 
4'he: d=8'h34; reg [b-1:0] rom [2**w-1:0] ; 


4'hf: d=8'’h56; initial begin 
default: d=8’h0; Sreadmemh (fileName, rom); 
endcase // case (a) end 
end // always@ (*) assign d = rom[a] ; 


endmodule endmodule // rom_reg 





图 8-48 用 Verilog 中 的 case 语句 构建 ROM, 图 8-49 ”实现 任意 大 小 ROM 的 Verilog 代码 。 仿 真 


因为 没有 参数 化 且 不 便于 修改 ， 建 议 或 综合 时 ， 通 过 文件 filename 将 数据 
使 用 图 8-49 中 的 代码 结构 加 载 来 实现 ROM 初始 化 


尽管 通过 case 语句 或 者 reg 阵列 ，ROM 可 以 实现 模块 化 ， 但 是 当 ROM 尺寸 高 于 临界 值 时 
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CLF), ROM 模块 一 般 应 采用 定制 方式 ， 而 不 是 综合 出 逻辑 模块 。 这 样 做 的 原因 ， 首 先 ， 
经 过 优化 电路 设计 和 布局 ，ROM 通常 比 同 等 规模 的 逻辑 电路 要 小 得 多 ， 而 且 速 度 也 更 快 ; 其 
次 ， 只 要 ROM 的 大 小 没有 改变 ， 规 则 的 结构 使 我 们 在 改变 它 的 内 容 时 不 用 改变 整体 布局 ， 仅 
对 ROM 的 内 部 构件 进行 小 的 修改 就 可 以 了 。 一 些 ROM 还 可 以 通过 仅 改变 一 个 金属 层 来 实现 编 
程 化 ， 从 而 使 修改 ROM 内 容 变 得 相对 经 济 。 

大 多 数 ROM 的 内 容 在 生产 时 就 已 经 被 确定 ， 这 与 某 个 晶体 管 是 否 存在 有 关 。 可 编程 
ROM， 或 者 叫 PROM， 在 制作 时 并 未 存 和 任何 数据 ， 而 且 它 能 够 在 加 电 后 通过 熔断 保险 丝 或 者 
在 浮动 栅 极 上 放置 电荷 来 编程 。 使 用 PROM 可 以 减少 一 些 额 外 的 成 本 ， 从 而 使 小 容量 的 应 用 变 
得 更 加 经 济 ， 否 则 还 需要 配置 一 个 ROM。 某 些 PROM 是 一 次 性 编程 的 ， 也 就 是 说 一 旦 被 写 人 
就 不 能 再 改变 。 可 擦 除 可 编程 ROM ， 或 者 EPROM， 可 以 多 次 进行 擦 除 和 编程 。EPROM 的 擦 除 
方式 有 两 种 ， 一 种 是 通过 将 其 暴露 在 UV 光 (紫外 线 ) 下 实现 擦 除 (UV-EPROM ) ， 另 一 种 是 
电 可 擦 除 的 ( EEPROM) 。 


8.9 读 写 存储 器 

读 写 存储 器 ， 或 者 叫 RWM， 与 ROM 相似 ， 但 不 同 的 是 它 允 许 表 中 的 内 容 被 更 改 和 写 入 。 
由 于 历史 原因 ， 读 写 存储 器 通常 被 叫做 RAM. 目前 几乎 普遍 使 用 术语 RAM 来 指 代 RWM， 所 
以 我 们 也 采用 这 种 叫 法 。 严 格 来 讲 ，RAM 是 一 种 时 序 逻 辑 电路 ， 它 的 输出 依赖 于 它 的 输入 ， 
因此 我 们 将 RAM 的 讨论 推迟 到 第 14 章 。 但 由 于 RAM 是 常用 的 一 种 元 器 件 ， 所 以 在 这 里 我 们 
先 介绍 一 些 关 于 RAM 的 基础 知识 。 

图 8-50a 为 单 端口 RAM 的 原理 图 符号 。 如 果 写 入 信号 wr 为 低 ，RAM 与 ROM 完全 相同 。 
输入 端 a 用 来 提供 访问 地 址 ,输出 端 do 输出 该 地 址 的 内 容 。 当 信号 wr 为 高 时 ， 执 行 写 操作 。 
输入 端 由 上 的 值 被 写 入 地 址 a 中 。 我 们 在 寻 址 的 同时 将 wr 设置 为 高 ， 就 可 以 将 数据 存储 在 
RAM 的 某 一 地 址 内 ， 随 后 将 wr 设置 为 低 并 再 次 对 该 地 址 寻 址 就 可 以 读 出 之 前 存 人 的 数据 。 

对 于 图 8-50a 中 的 单 端 口 RAM， 同 一 时 间 只 能 根据 地 址 a 访问 一 个 单元 。 如 果 数 据 正 要 被 
写 入 地 址 a， 此 时 不 能 读 取 其 他 地 址 单元 ,但 采用 双 端 口 RAM 可 以 解决 这 个 问题 。 图 8-50b 为 
双 端 口 RAM 的 原理 图 符号 。 对 于 双 端口 RAM， 读 端口 〈 信 号 ae 和 do) 与 写 端口 (信号 ai, di 
和 wr) 是 相互 独立 的 。ao 所 指 单元 的 数据 被 读 取 到 输出 端 de 上 ， 同 一 时 间 输 入 端 出 也 可 以 被 
BA ai 所 指 的 单元 中 。 双 端口 RAM 通常 用 于 连接 两 个 子 系统 ， 一 个 子 系统 对 RAM 进行 写 人 ， 
男 一 个 子 系统 从 中 读 取 数据 。RAM 的 读 取 和 写 人 端口 数 可 以 为 任意 值 ， 但 是 RAM 的 成 本 会 随 
着 端口 数量 的 增加 按 平方 增长 。 





图 8-50 RAM 原理 图 符号 。 如 果 输 入 线 wr 为 真 ， 输入 的 数据 出 被 写 到 相应 的 位 置 上 。a) 单 
端口 RAM， 读 操作 和 写 操作 共享 地 址 线 。b) 双 端 口 RAM 的 地 址 线 是 独立 的 : ao 用 
于 读 取 ，ai 用 于 写 入 
图 8-51 用 两 个 译 码 器 、 锁 存 器 和 三 态 缓冲 器 实现 了 一 个 简单 的 双 端 口 RAM。 读 译 码 器 和 
三 态 缓冲 器 组 成 的 电路 结构 与 图 8-46 中 的 ROM 相同 。 读 取 地 址 ao 经 译 码 后 形成 N 个 读 字 选择 





© RAM E random access memory 的 缩写 。 我 们 定义 的 ROM 和 RAM 都 是 允许 随机 访问 的 ， 即 每 一 个 地 址 都 可 以 按 
任何 顺序 访问 。 与 此 相反 ,磁带 是 顺序 访问 存储 器 ， 即 磁带 上 存储 的 字 必 须 按 顺 序 访问 。 





ZK Woo, =, Woyo 每 一 个 读 字 选 择 线 选 择 对 应 位 置 的 数 从 do 输出 。 

RAM 读 端 口 和 ROM 的 区 别 在 于 每 一 个 地 址 上 的 
数据 是 从 锁 存 器 中 得 到 的 (而 ROM 中 是 一 个 常量 ) 。 
锁 存 器 是 一 个 简单 的 存储 元 件 ， 当 使 能 端 G 为 高 时 ， 
输入 D 从 Q 输 出 。 当 G 为 低 时 ， 输 出 Q 保持 之 前 的 
值 ， 这 为 我 们 提供 了 一 个 简单 的 一 位 存储 器 。27. 1 T 
中 对 于 锁 存 莫 有 更 详细 的 描述 。 

RAM 写 端 口 设 有 写 译 码 器 ， 当 wr 有 效 时 ， 输 出 
地 址 ai 经 过 译 码 器 并 选择 线 wio，…，wiw_1 中 的 一 根 。 
当 wr 无 效 时 ， 所 有 的 字 选 择 线 保持 低 电 平 。 当 地 址 i 
被 写 人 时 ， 字 选择 线 wi, 变 为 高 ，di 上 输入 的 数据 被 
存储 到 第 ;个 锁 存 器 中 。 当 地 址 改变 或 者 wr 变 为 低 ， 


wi, 变 为 低 电 平 ， 锁 存 器 保持 存储 的 数据 。 图 8-51 WO RAM 可 以 通过 两 个 译 码 器 

与 ROM 一 样 ， 实 际 RAM 在 实现 上 比 这 里 列举 的 和 锁 存 器 实现 数据 的 写 入 ， 通 过 
简单 例子 要 高 效 得 多 。 大 多 数 的 RAM 采用 二 维 结构 ， 三 态 缓冲 器 阵列 实现 读 取 。 实 际 
与 图 8-47 中 给 出 的 ROM 相似 。 对 于 写 操作 而 言 ， 列 的 RAM 为 二 维 结构 ， 其 存储 单元 采 
“ 复 用 ”较为 复杂 ， 这 里 不 做 深入 的 讨论 。 最 实用 的 用 更 有 效 的 电路 设计 


RAM 中 的 位 单元 也 比 这 里 给 出 的 锁 存 器 加 三 态 缓冲 器 的 结构 高 效 。 大 多 数 静 态 RAM (SRAM) 使 
用 的 存储 单元 是 由 6 个 晶体 管 构成 的 ， 现 代 动 态 RAM (DRAM) 中 的 存储 单元 是 由 一 个 晶体 管 和 
一 个 存储 电容 器 构成 的 。 这 些 存 储 器 单元 的 电路 细节 不 在 本 书 的 讨论 范围 内 。 

图 8-52 中 给 出 了 一 个 双 端 口 RAM 的 Verilog 代码 。 读 功能 与 图 8-49 中 的 ROM 一 样 ; 写 功 
能 是 在 always 模块 实现 的 ， 当 信号 write 为 高 时 ,根据 地 址 更 新 写 入 的 数据 。 当 write 为 低 
时 ， 最 后 一 个 写 人 地址 的 数据 被 保存 下 来 。 就 像 上 文 提 到 的 ， 由 于 RAM 能 够 保存 状态 ， 因 此 
它 不 是 组 合 电路 而 是 一 个 时 序 电路 ( 见 第 14 章 )。 与 图 8-49 中 的 ROM 不 同 ，RAM 没有 被 初 
始 化 。 为 避免 得 到 未 定义 的 数据 ， 每 一 个 地 址 在 读 取 前 必须 被 写 和 人。 大 多 数 RAM 模块 都 有 一 
个 同步 接口 ， 需 要 一 个 时 钟 沿 来 实现 读 取 或 写 人 操作 。 在 第 25 章 我 们 将 深入 讨论 RAM 模块 。 


// 大 小 与 宽度 可 修改 的 RAM 
module ram_reg(ra, wa, write, din, dout); 
parameter b = 32; 
parameter w = 4; 
input [w-1:0] ra, wa; 
input write; 
input [b-1:0] din; 
output [b-1:0] dout; 
reg [b-1:0] ram [2**w-1:0]; 
assign dout = ram[ra]; 
always@(*) begin 
if(write == 1) 
ram[wa] = din; 


end 





endmodule // ram_reg 


图 8-52 JH Verilog 实现 的 RAM 模块 。 当 输入 信号 为 高 时 ，din 被 写 人 地 址 wa 所 对 应 的 单元 
内 。 地 址 ra 上 存储 的 数据 被 连续 输出 





O FE SRAM 要 么 提供 一 个 复位 信号 要 么 将 逻辑 0 写 人 每 一 个 寄存 器 中 。 
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8.10 可 编程 逻辑 阵列 
可 编程 逻辑 阵列 ， 或 者 叫 PLA， 其 内 部 是 一 种 有 规律 的 结构 ， 经 过 配置 可 以 实现 任意 一 组 用 
积 之 和 表示 的 钦 辑 函数 。 如 图 8-53 所 示 ，PLA 是 由 < 
一 个 与 平面 和 一 个 或 平面 构成 的 。 与 平面 是 一 个 
二 维 结构 ， 其 中 垂直 方向 是 常量 (输入 量 的 真 值 
及 其 补 码 ) ， 水 平方 向 是 乘积 项 。 每 一 行 可 以 选择 
任意 一 组 常量 作为 与 门 的 输入 ， 从 而 实现 一 个 任意 的 
乘积 项 。 连 接 到 每 个 与 门 的 常量 在 图 中 用 方块 代表 。 
例如 ， 最 上 面 的 与 门 选择 三 个 常量 a。、a, 、a, 作 为 输 
A, 并 生成 它们 的 乘积 项 we Aa, 人 mw。 | 
与 平面 与 ROM 中 的 译 码 器 很 相似 ， 不 同 之 处 
是 与 阵列 每 一 行 的 乘积 项 是 任意 的 ， 而 译 码 器 每 ， 
一 行 的 乘积 项 是 该 行 地 址 对 应 的 最 小 项 。PLA 中 ， 
的 很 多 行 在 同一 时 间 都 处 于 高 电 平 ， 而 ROM 的 译 ， 
码 需 在 同一 时 间 只 有 一 行 是 有 效 的 。 iy 
或 阵列 也 是 一 个 二 维 结构 : 水 平方 向 为 乘积 图 8-53 “可 编程 迎 辑 阵列 (PLA) 由 一 个 与 平 





项 ,垂直 方向 为 输出 (和)。 每 一 列 上 的 任意 乘积 面 和 一 个 或 平面 组 成 。 通 过 编程 ， 任 
项 进行 或 操作 以 后 形成 一 个 输出 。 图 8-53 h, 44 意 一 组 乘积 项 都 可 以 由 与 平面 实现 。 
一 个 或 门 包含 的 乘积 项 用 方块 表示 。 例如， 最 右 这 些 乘积 项 通过 或 平面 实现 由 积 之 和 
边 的 列 中 或 操作 包含 了 下 面 的 三 个 乘积 项 。 表示 的 逻辑 函数 。 本 图 利用 PLA 实现 

在 实际 产品 中 ，PLA 通常 使 用 跟 与 阵列 和 或 了 一 个 完整 的 加 法 器 ， 其 中 与 平面 包 
阵列 相同 的 结构 一 一 与 非 门 (NAND) 或 者 非 门 含 7 个 乘积 项 ， 或 平面 包含 两 个 和 
(NOR)。 根据 德 . 摩根 律 ，NAND-NAND 结构 的 (分 别 表 示 加 法 和 及 进位 ) 


PLA 与 图 8-53 中 给 出 的 AND-OR 结构 的 PLA 是 等 效 的 。NOR-NOR 结构 实现 了 函数 的 互补 ， 并 
且 可 以 在 后 面 接 一 个 反 相 器 直接 实现 函数 。 高 度 优化 的 电路 通常 在 阵列 的 每 一 个 交叉 点 上 放置 
一 个 晶体 管 (或 者 不 放 )。 

大 多 数 PLA 在 制造 时 都 是 硬 连 线 的 。 每 一 个 乘积 项 中 的 常量 或 者 每 一 个 和 中 的 乘积 项 都 是 由 
晶体 管 存在 与 否决 定 。 在 一 些 PLA 中 ， 通 过 一 个 存储 位 来 配置 乘积 项 中 是 否 包 含 常 量 或 者 和 中 是 
否 包 含 乘积 项 。 在 多 数 情况 下 ， 这 种 可 配置 的 PLA 的 尺寸 比 同等 硬 连 线 结构 PLA 大 得 多 。 


8.11 数据 手册 


在 一 个 规模 较 大 的 设计 中 ， 设 计 者 通常 在 不 了 解 基本 器 件 和 子 系统 是 如 何 实现 的 情况 下 使 
用 它们 。 这 个 时 候 ， 设 计 者 依靠 的 是 这 些 模块 的 说 明 书 。 说 明 书 通常 被 叫做 数据 手册 ， 它 给 出 
了 模块 使 用 的 详细 信息 ， 但 往往 会 忽略 其 内 部 细节 。 数 据 手册 通常 包含 以 下 内 容 。 

1) 模块 的 功能 描述 一 一 该 模块 实现 了 什么 。 应 该 有 足够 的 细节 来 描述 完整 的 模块 行为 。 
对 于 组 合 逻 辑 电 路 ， 通 常会 用 真 值 表 或 方程 来 描述 模块 的 功能 。 

2) 模块 输入 输出 的 详细 描述 : 依次 介绍 每 一 个 信号 ， 并 给 出 信号 的 名 称 、 宽 度 、 方 向 和 
简短 描述 。 

3) 如 果 有 ， 给 出 所 有 模块 参数 的 描述 。 

4) 模块 中 所 有 状态 和 寄存 器 的 描述 (对 于 时 序 模块 ) 。 

5) 模块 的 同步 时 序 : 模块 的 周期 级 时 序 。 

6) 具体 的 时 序 : 一 个 周期 中 的 输入 和 输出 信号 的 时 序 。 

7) 模块 的 电气 性 能 : 电源 、 功 耗 、 输 入 和 输出 信号 电 平 、 输 入 载荷 以 及 输出 驱动 能 力 。 





这 里 暂时 不 讨论 5) 和 6) ， 介 绍 完 时 序 电路 和 时 序 后 再 作 讨论 。 

图 8-54 是 一 个 假想 的 4 - 16 译 码 器 的 数据 手册 。 图 中 描述 了 模块 的 行为 ， 但 没有 描述 它 的 实现 。 
模块 功能 是 由 公式 (b =1 < <a) 确定 。 我们 也 可 以 很 容易 地 用 一 个 16 行 的 真 值 表 把 它 的 功能 措 
述 出 来 。 时 序 部 分 描述 了 这 个 模块 的 传播 延迟 和 污染 延迟 ( 见 第 15 章 ) ， 单 位 为 皮 秒 (ps). Bh 
后 ， 电 气 部 分 给 出 了 单位 为 飞 法 (全) 的 输入 载荷 及 单位 为 千 欧 kQ) 的 输出 电阻 (驱动 )。 


Name: decode 4 16 


Description: 4 to 16 decoder 


Inputs: 
Name Width Direction Description 
a 4 in binary input 
b 16 out ` one-hot output 


Function: 


b = l<<a 


Timing: 
Parameter Min Units Description 
t_dab ps Delay from a to b - no load on b 
t_cab 100 ps Contamination delay from a to b - no load on b 


Electrical 
Parameter Min Units Description 


ca £F Capacitance of each bit of a 





rb 5 kOhms Effective output resistance of each bit of b 
图 8-54 4-16 译 码 器 数据 手册 示例 


基础 单元 是 一 种 物理 芯片 ， 数 据 手册 中 的 电气 特性 和 时 序 均 为 实际 值 。 但 对 于 一 个 没有 被 
综合 的 Verilog 模块 ， 这 些 参数 是 不 知道 的 。 例 如 ， 在 综合 和 物理 设计 完成 之 前 ， 每 个 输入 的 
电容 负载 是 无 法 获知 的 。 

约 来 文件 用 来 指定 时 序 和 电气 参数 期 望 的 | ac yi aan cell meva (a) 
目标 。 这 些 目标 (或 者 约束 ) 可 用 于 指导 工具 É j T 
进行 综合 和 物理 设计 。 图 8-55 中 给 出 了 一 个 非 
常 简单 的 4 - 16 译 码 器 的 约束 文件 。 这 个 文件 Bls. 4-16 eae H ta 
可 在 Synopsys Design Compiler® 中 使 用 。 文 件 中 指定 从 译 码 器 a Bl b 的 延迟 不 能 超过 0.2 ns, jÉ 
指定 输入 a 在 驱动 INVA 单元 时 由 库 中 等 效 的 单元 驱动 ， 而 不 是 指定 了 输入 负载 。 如 果 综 合 器 
造成 输入 电容 过 大 ， 这 个 单元 驱动 a 产生 的 延迟 (包含 在 总 延迟 中 ) 会 使 它 很 难 满 足 时 序 约 
束 。 最 后 ,文件 中 还 指定 输出 负载 4 的 每 一 位 是 5 (电容 单位 )。 综 合 器 必须 将 译 码 器 的 输出 
驱动 设置 得 足够 大 ， 以 免 驱动 负载 时 造成 过 多 延迟 。 


8.12 ”知识 产权 


一 个 设计 团队 在 设计 一 款 蕊 片 时 ， 往 往 会 将 从 其 他 地 方 获得 的 一 些 模块 融入 自己 的 设计 
中 。 这 些 从 其 他 来 源 获得 的 模块 通常 叫做 耳 ， 即 知识 产权 。 


set load -pin load 5 {b} 





日 ”知识 产权 (IP) 这 个 术语 所 指 的 范围 要 比 这 里 用 到 的 更 广泛 。 独 立 于 物理 对 象 的 任何 有 价值 的 东西 都 可 称 为 
了 P。 也 就 是 说 ， 这 个 价值 是 智力 因素 创造 的 ， 而 不 是 通过 制造 业 创 造 出 来 的 。 例 如 ， 所 有 的 软件 、 书 籍 、 电 
影 、 音 乐 、 设 计 ， 包括 Verilog 设计 都 是 IP. 
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IP 模块 可 以 从 供应 商 或 者 开源 的 项 目 中 获得 。 一 些 厂 商 专注 于 特殊 类 型 的 卫 。 例 如 ，ARM 
公司 和 MIPS 公司 专门 销售 微 处 理 器 的 全。 大 多 数 手机 微 处 理 器 都 是 从 ARM 公司 获得 IP 授权 的 。 

软件 行业 具有 革命 性 的 开源 运动 也 同样 出 现在 硬件 世界 里 。 在 开源 网 站 http://www. 
opencores. org 上 可 以 免费 获得 很 多 有 用 的 Verilog IP 模块 ， 包 括 处 理 器 、 接 口 ( 例 如， 以 
A. PCI. USB 等 ) 、 加 密 / 解 密 模 块 、 压 缩 /解压 缩 模 块 及 其 他 一 些 模块 。 虽 然 这 些 模 块 比 本 
章 中 描述 的 那些 要 复杂 得 多 ， 但 概念 是 相通 的 。 设 计 团 队 通过 组 合 各 种 模块 来 实现 一 个 系统 。 
数据 手册 (MAGIC) 对 这 些 模块 进行 了 描述 ， 指 定 了 它们 的 功能 、 接 口 和 参数 。 

与 其 他 商品 相似 ，IP 一 经 出 售 概 不 负责 ( 买 家 需要 小 心 ) 。 购 买 的 卫 并 不 总 是 符合 它 的 规 
范 。 谨 慎 的 设计 者 应 该 彻底 地 测试 拿 到 的 每 一 个 IP. 


小 结 

通过 本 章 学 习 ， 读 者 应 该 已 经 学 到 了 数字 设计 中 的 一 些 常见 的 设计 模式 和 术语 。 在 设计 中 
反复 会 用 到 的 常见 电路 包括 : 

译 码 器 能 够 将 一 个 二 进 制 编码 的 信号 转换 为 独 热 码 表示 的 信号 。 例 如 ， 我 们 可 以 用 它 来 选 
择 存储 器 众多 行 中 的 一 行 。 

编码 器 做 反 向 操作 ,将 独 热 码 信 号 转换 为 一 个 二 进 制 编码 。 

仲裁 器 能 够 在 输入 字 中 找到 第 一 个 高 位 〈 从 右 侧 或 者 左 侧 开始 查找 ) 。 例 如 ， 它 们 可 以 用 
来 控制 共享 资源 的 访问 及 格式 化 浮 点 数 。 将 仲裁 器 和 编码 器 组 合 起 来 就 可 以 形成 一 个 优先 编码 
器 。 仲 裁 器 找到 输入 信号 中 的 第 一 个 1， 然 后 编码 器 将 这 个 独 热 码 信号 转换 为 二 进 制 编码 ， 输 
出 的 二 进 制 编码 就 是 第 一 个 1 所 对 应 的 位 置 。 

多 路 选择 器 在 独 热 码 选择 信号 的 控制 下 ， 从 多 个 输入 中 选择 一 路 输出 。 它 用 来 进行 数据 管 
理 , 广泛 应 用 于 在 各 种 类 型 的 数据 通路 中 。 将 译 码 器 和 多 路 选择 器 结合 起 来 可 以 构成 二 进 制 选 
择 多 路 选择 器 。 译 码 器 将 二 进 制 选择 信号 转换 为 独 热 码 ， 然 后 多 路 选择 器 根据 转换 结果 选择 其 
中 一 个 作为 输入 。 

比较 器 用 来 比较 两 个 二 进 制 数 ， 并 指出 它们 是 否 相 等 或 者 判断 大 小 。 比 较 器 通常 用 迁 代 电 
路 实现 。 

移 位 器 可 以 对 输入 信号 进行 移动 或 循环 移动 。 例 如 ， 在 浮 点 数 加 法 中 用 来 对 齐 。 

存储 器 是 一 个 只 读 (ROM) 或 者 可 读 可 写 (RAM) 的 表 。 只 要 给 出 一 个 地 址 ， 存 储 器 就 
可 以 返回 这 个 地 址 中 所 存储 的 值 。 对 于 RAM， 可 以 将 数据 写 人 相应 的 地 址 中 。 有 关 存 储 器 的 
更 多 细节 将 在 第 25 章 中 讨论 。 

一 些 电路 当 规模 变 大 时 可 以 用 多 个 小 的 模块 按照 树 形 方式 组 成 ， 如 译 码 器 、 编 码 器 和 多 路 
选择 器 。 当 模块 的 规模 很 大 的 时 候 ， 采 用 这 种 分 层 结构 要 比 平 行 的 方式 去 实现 所 需 的 门 少 得 
多 ， 且 速度 更 快 、 能 耗 更 低 。 

基础 单元 (或 其 他 模块 ) 经 常 在 设计 中 使 用 ， 不 用 理解 它们 内 部 是 如 何 实现 的 。 数 据 手 
册 中 可 以 找到 有 关 这 些 IP 模块 外 部 特征 的 描述 。 


文献 说 明 


TTL 数据 手册 [102] ， 最 早 在 20 世纪 70 年 代 出 版 ， 描 述 了 经 典 的 7400 系列 TTL 逻辑 系 
列 中 可 以 作为 独立 芯片 使 用 的 元 器 件 的 功能 。 这 些 元 器 件 包 括 了 简单 的 门 、 多 路 选择 器 、 译 码 
句 、 七 段 译 码 器 、 算 术 函 数 、 寄 存 器 、 计 数 器 ( 见 第 16 章 ) 等 。TTL 数据 手册 为 我 们 提供 了 
有 关 数 据 手 册 的 很 多 好 的 范例 。 每 一 部 分 都 列 出 了 功能 、 接 口 、 电 气 参 数 和 时 序 参数 。 

FPGA 厂商 经 常会 给 设计 者 提供 一 个 构建 模块 的 库 。Altera 的 参数 化 模块 库 [1] 就 是 这 样 
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的 例子 。 它 包含 了 译 码 器 、 多 路 选择 器 以 及 在 第 10 章 中 讨论 的 很 多 算术 电路 。 


一 些 数字 集成 电路 教科 书 ， 如 [91] 和 [108] ,探讨 了 RAM. ROM 和 PLA 的 设计 ， 感 兴 


趣 的 读者 可 查阅 。 
习题 


8.1 
8.2 
8.3 


8.4 
8.5 
8.6 
8.7 


8.8 
8.9 
8. 10 
8. 11 


8. 12 


译 码 器 。 用 Verilog 描述 一 个 3 -8 译 码 器 。 

译 码 器 逻辑 。 用 4 一 16 译 码 器 和 或 门 实现 一 个 七 段 译 码 器 。 

双 热 码 译 码 器 。 考 虑 一 下 双 热 码 信号 的 字母 表 ， 就 是 二 进 制 信号 有 两 位 是 等 于 1 的 。 这 里 有 (n(n - 
1) ) /2n 位 双 热 码 符号 。 假 定 这 些 符号 按 二 进 制 数 值 来 排序 ， 对 于 n =5， 顺序 是 00011, 00101, 
00110, «+, 11000, 设计 一 个 4-5 的 二 进 制 到 双 热 码 的 译 码 器 。 

大 型 译 码 器 ，[。 用 Verilog 实现 一 个 5 -32 译 码 器 ， 基 础 单元 采用 一 个 2 -4 译 码 器 和 一 个 3 -8 译 码 器 。 
KAZ, H. H Verilog 实现 一 个 6 一 64 译 码 器 ， 基 础 单元 使 用 3 -8 译 码 器 。 

大 型 译 码 器 ， 亚 。 用 Verilog 实现 一 个 6 -64 译 码 器 ， 基 础 单元 使 用 2 -4 译 码 器 。 

分 布 式 多 路 选择 器 。 实 现 一 个 大 型 (32 HA) 多 路 选择 器 ， 其 中 每 个 多 路 选择 器 输入 端 和 它 相 关 
联 的 选择 信号 均 位 于 同一 芯片 的 不 同 区域 。32 个 输入 和 选择 信号 分 布 在 一 个 长 0.4 mm 的 线 上 。 说 
明 如 何 使 用 静态 CMOS 门 电路 (例如 ， 与 非 门 、 或 非 门 、 反 相 器 一 一 无 三 态 ) 来 实现 ， 要 求 相 邻 输 
入 位 置 之 间 只 有 一 根 导线 。 

多 路 选择 器 逻辑 。 用 一 个 8 一 1 二 进 制 选 择 多 路 选择 器 实现 一 个 4 位 的 斐 波 那 契 电路 〈 如 果 输 入 为 
斐 波 那 契 数 ， 输 出 为 真 ) 。 

译 码 器 测试 平台 。 用 编码 器 作 测 试 器 ， 编 写 4 - 16 译 码 器 的 测试 平台 。 

双 热 码 编码 器 。 按 照 习题 8. 3 的 要 求 ， 设 计 一 个 5 -4 双 热 码 编码 器 。 

可 编程 优先 编码 器 。 用 Verilog 编写 一 个 优先 级 可 编程 的 优先 编码 器 ， 要 求 根据 输入 CORAM) (ë 
号 决定 哪 一 位 拥有 最 高 优先 级 ， 优 先 级 从 该 位 向 右 依次 降低 。 

二 进 制 优先 级 仲裁 器 。 用 Verilog 编写 一 个 优先 级 可 编程 的 优先 编码 器 ， 由 输入 的 二 进 制 信号 决定 
哪 一 位 有 最 高 的 优先 级 ， 优 先 级 从 该 位 向 右 依 次 降低 。 

循环 仲裁 器 。 设 计 一 个 仲裁 器 ， 每 个 周期 最 高 优先 级 位 于 之 前 赢得 仲裁 的 那 一 位 输入 的 右 侧 (J 
M). 。 假 定之 前 的 获胜 者 为 模块 的 输入 。 

比较 器 。 编 写 一 个 任意 宽度 的 数值 比较 器 ， 信 息 从 MSB 到 LSB 向 下 传递 ， 如 图 8-40 所 示 。 

三 路 数值 比较 器 ，[。 用 Verilog 编写 一 个 三 路 数值 比较 器 ， 如 果 三 个 输入 严格 按照 a >b >c， 输 出 真 。 

三 路 数值 比较 器 ， H. 用 Verilog 编写 一 个 三 路 数值 比较 器 ， 如 果 三 个 输入 严格 按照 aSbec, HA. 

桶 形 移 位 器 。 用 Verilog 编写 一 个 i 到 j 的 桶 形 移 位 器 ， 其 中 输入 端 a 为 i 位 、 移 动 位 数 n H 1 =log, 
(i-j) 位 ,输出 b=a [n+j -1: n] 的 位 数 满足 j<i。 

使 用 基础 单元 ， 工 。 使 用 基础 单元 〈 例 如 二 进 制 加 法 器 、 比 较 器 、 多 路 选择 器 、 译 码 器 、 编 码 器 、 
仲裁 器 和 逻辑 门 ) ， 设 计 一 个 8 x2 的 常用 电路 ， 该 电路 的 输入 为 8 个 2 位 的 二 进 制 数 ， 输 出 为 4 
个 2 位 的 二 进 制 数 在 输入 中 出 现 的 次 数 。 修 改 电路 将 出 现 次 数 最 多 的 2 位 数字 输出 〈 大 数 优先 ) 。 
使 用 基础 单元 ， 开 。 设 计 一 个 组 合 电路 ， 从 3 个 8 位 输入 中 输出 数值 最 小 的 。 

使 用 基础 单元 ， 亚 。 设 计 一 个 组 合 电路 ， 从 3 个 8 位 输入 中 输出 数值 居中 的 一 个 〈 既 不 是 最 大 也 
不 是 最 小 ) 。 

ROM 逻辑 一 一 质数 函数 。 用 ROM 实现 一 个 4 位 质数 函数 。ROM 需要 多 大 (N 和 4 是 什么 )? 每 一 
个 地 址 上 存储 的 数据 是 什么 ? 

ROM 逻辑 一 一 七 段 译 码 器 。 用 ROM 实现 一 个 七 段 译 码 器 。ROM 需要 多 大 (NN 和 4 是 什么 )? 每 
一 个 地 址 上 存储 的 数据 是 什么 ? 

PLA 一 一 质数 函数 。 用 PLA 实现 一 个 4 位 质数 函数 。 需 要 多 少 个 乘积 项 与 和 项 ? 每 一 项 之 间 是 如 
何 连 接 的 ? 

PLA 一 一 七 段 译 码 器 。 用 PLA 实现 一 个 七 段 译 码 器 。 需要 多 少 个 乘积 项 与 和 项 ?每 一 项 之 间 是 如 
何 连接 的 ? 
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第 9 章 | 


Digital Design: A Systems Approach 


组 合 电路 实例 





在 这 一 章 ， 我 们 将 通过 几 个 组 合 电路 实例 来 巩固 前 边 章节 的 知识 。3 的 倍数 电路 是 另 一 个 
迭代 电路 实例 。1. 4 节 中 的 明天 电路 是 具有 分 支 电路 的 计数 器 电路 的 模块 化 实例 。 优 先 级 仲裁 
器 由 前 边 章节 介绍 的 模块 构建 而 成 ， 是 基础 单元 电路 的 实例 。 最 后 ， 井 字 棋 游戏 电路 给 出 了 一 
个 复杂 的 结合 了 许多 概念 的 电路 实例 。 


9.1 3 的 倍数 电路 


在 本 节 中 我 们 开发 一 个 电路 ， 用 于 判断 输入 的 数字 是 否 是 3 的 倍数 。 我 们 用 迭代 电路 实现 
该 功能 (就 像 实现 8. 6 节 中 的 数值 比较 器 一 样 ) 。 和 迭代 实现 3 的 倍数 电路 的 框图 如 图 9-1 所 示 。 
该 电路 从 最 高 有 效 位 开始 检测 输入 数字 ， 一 次 检测 一 位 。 在 每 一 位 ， 都 计算 当前 的 余数 (0、1 
或 2) 。 在 最 低 有 效 位 我 们 检测 全 部 的 余数 是 否 为 0。 当 前 余数 放 在 每 个 位 单元 左 侧 ， 在 右 侧 放 
置 输入 的 当前 位 以 及 计算 当前 余数 。 





图 9-1 3 的 倍数 电路 框图 。 该 电路 计算 模 3 的 余数 ， 从 左边 MSB 到 右边 LSB， 每 次 计算 一 位 
输入 数字 。 每 一 个 位 单元 计算 由 remin 中 的 余数 和 当前 输入 in 连接 组 成 的 三 位 数字 
的 余数 。 如 果 最 后 低位 的 余数 为 0， 则 输入 数字 为 3 的 倍数 
迭代 实现 3 的 倍数 电路 的 位 单元 的 Verilog 模块 如 图 9-2 所 示 。 保 存在 remin 中 的 余数 表 
示 相 邻 位 以 左 的 余数 ， 因 此 相对 于 当前 位 的 位 置 权 重 为 2。 在 我 们 的 相 邻 位 ， 该 信号 表示 余数 
为 0、1 或 2。 然 而 , 在 当前 位 ， 此 信和 号 左 移 一 位 ， 它 的 值 表 示 为 0、2、4。 因 此 我 们 可 以 将 
remin 和 输入 的 当前 位 in 连接 起 来 形成 一 个 三 位 二 进 制 数 ， 然 后 取 这 个 数 模 3 的 余数 。 用 
case 语句 来 计算 新 的 余数 。 


// Multiple of 3 bit 
// 和 迭代 实现 3 的 倍数 电路 的 电路 单元 
// 确定 从 当前 位 到 最 高 有 效 位 形成 的 数 的 余数 模 3) 
// 输入 : 
// in 一 一 检查 的 数 的 当前 位 
remin 一 一 最 后 一 位 检测 后 的 余数 (2 位 ) 


remout 一 一 检测 该 位 以 后 的 余数 (2 位 ) ` 


// remin 的 位 置 权重 为 2， 因 此 {remin, inj 组 成 一 个 3 位 二 进 制 数字 
// 将 这 个 数 除 以 3 得 到 的 余数 输出 到 remout 端 





图 9-2 Verilog 编程 实现 3 的 倍数 电路 的 位 单元 
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module Multiple of 3 bit(in, remin, remout) ; 


input in ; 


input [1 


:0] remin ; 


output [1:0] remout ; 


reg [1:0] remout ; 


always @(*) begin 


case({remin, in}) 


ardo: 
"es 
a'ga: 
3 33: 
3'd4: 
3 a5: 
3'dé: 
3'd7: 


remout 
remout 
remout 
remout 
remout 
remout 


remout 


FON F ON hF O 


remout 


default: remout = 2'hx; 


endcase 


end 
endmodule 





图 9-2 (8) 


图 9-3 给 出 了 3 的 倍数 模块 的 顶层 设计 。 该 模块 将 图 9-2 中 的 位 单元 实例 化 了 8 个 副本 。 
位 单元 之 间 通 过 传输 从 一 个 单元 到 下 一 个 单元 的 两 位 余数 进行 连接 ,用 16 位 信号 rem 表示 。 
最 后 ， 通 过 比较 余数 输出 是 否 为 0 来 生成 输出 信和 号 。 


// Multiple_of_3 
// 判断 输入 是 否 3 的 倍数 
// 输入 : 
// in 一 一 8 位 二 进 制 数 
// 输出 : 
out 一 一 如 果 是 3 的 倍数 则 为 真 


module Multiple of 3(in, out) 


input [7:0] in ; 
output out ; 


wire [15:0] rem ; // 每 个 单元 两 位 余数 


// 实例 化 8 个 位 单元 

Multiple of 3 bit b7(in[7],2’b0O,rem[15:14]) ; 
Multiple of 3 bit b6é(in[6],rem[15:14],rem[13:12]) ; 
Multiple of 3 bit b5(in[5],rem[13:12],rem[11:10]) ; 





9-3 8 位 3 的 倍数 电路 的 Verilog 程序 。 该 模块 实例 化 8 个 图 9-2 中 的 位 单元 模块 ， 并 且 检 
测 最 后 输出 是 否 为 0 
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Multiple of 3 bit b4(in[4],rem[11:10],rem[9:8]) ; 
Multiple cf 3 bit b3(in[3],rem[9:8],rem[7:6]) ; 
Multiple of 3 bit b2(in[2],rem[7:6],rem[5:4]) ; 
Multiple of 3 bit bi(in[1],rem[5:4],rem[3:2]) ; 


Multiple of 3 bit bO(in[0],rem[3:2],rem[1:0]) ; 


// 如 果 余数 输出 为 0， 则 输出 结果 为 真 
assign out = (rem[1:0] == 2'b0) ; 





endmodule 


图 9-3 (4) 


虽然 这 个 模块 接受 8 位 输入 信号 ,但 是 很 容易 通过 实例 化 和 连接 适当 数量 的 位 单元 来 创建 
任意 长 度 的 3 的 倍数 电路 。 

3 的 倍数 电路 的 测试 平台 见 图 9-4。 测 试 平台 通过 用 Verilog 取 模 操作 符 % 来 验算 模 3 的 余 
数 ， 从 而 检测 当前 测试 电路 的 结果 。 需 要 注意 的 是 ,我 们 不 希望 在 电路 本 身 的 程序 里 使 用 多 操 
作 符 ， 因 为 使 用 该 操作 符 将 使 得 综合 程序 实例 化 一 个 高 成 本 的 除法 器 。 但 是 ， 在 测试 平台 中 使 
用 操作 符 % 是 没有 问题 的 ， 因 为 测试 平台 不 用 综合 。 

测试 平台 定义 了 测试 设备 的 输入 、 输 出 信和 号， 实例 化 了 3 的 倍数 模块 ， 然 后 遍历 了 所 有 
可 能 的 输入 状态 。 在 每 一 种 输入 状态 下 ， 测 试 模 块 的 输出 都 和 用 % 操作 符 计算 的 输出 进行 
比较 。 如 果 两 个 结果 不 匹配 ， 则 标记 出 错 信 息 。 如 果 所 有 状态 测试 结果 都 匹配 ， 则 通过 
测试 。 


module testMul3 ; 
reg [7:0] in ; 
reg error ; 


wire out ; 
Multiple_of_3 dut(in, out) ; 


initial begin 
in = 0 ; error = 0 ; 
repeat (256) begin 
#100 
// $display("%d %b",in,out) ; 
if(out !== ((in %3) == 0)) begin 
$display ("ERROR %d -> %b",in,out); 
eFrer = 1 i 


in + J j 


if (error == 0) $display("PASS") ; 
end 





endmodule 


图 9-4 Verilog 实现 3 的 倍数 电路 的 测试 平台 
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9.2 明天 电路 


在 1.4 节 中 我 们 介绍 了 一 个 日 历 电路 。 这 个 电路 的 关键 模块 是 明天 电路 ， 明 天 电路 给 定 今 
天 在 本 月 中 的 日 期 、 月 的 天 数 、 星 期 几 的 格式 ， 以 相同 的 格式 计算 出 明天 的 日 期 。 在 这 一 节 中 
我 们 将 用 Verilog 编程 实现 这 个 明天 电路 。 

数字 电路 设计 的 关键 步骤 是 将 大 的 问题 划分 为 简单 的 子 问题 。 然 后 就 可 以 设计 简单 的 模块 
来 解决 这 些 子 问 题 ， 将 这 些 子 问 题 模块 组 合 起 来 解决 我 们 的 大 问题 。 在 明天 电路 中 我 们 可 以 定 
义 两 个 子 问题 : 

1) 增加 星期 几 功 能 (星期 几 和 月 份 或 月 的 天 数 无 关 ); 

2) 确定 当前 月 的 天 数 。 

图 9-5 给 出 了 增加 星期 几 功 能 的 Verilog 模块 。 如 果 当 前 日 期 是 ' SATURDAY (定义 成 7)， 
此 模块 设置 明天 为 'SUNDAY (定义 成 1)。 如 果 当 前 日 期 不 是 ' SATURDAY， 该 模块 将 今天 加 一 
得 到 明天 。 

在 16. 1 节 中 我 们 将 看 到 NextDayOfWeek 模块 是 计数 器 的 组 成 部 分 ， 计数器 是 一 个 状态 
增加 的 电路 。 这 里 与 计数 器 不 同 的 是 当 计 数 需 到 达 ' SATURDAY 时 复位 为 'SUNDAY。 

该 模块 通过 定义 'SATURDAY 和 ' SUNDAY 进行 编码 。 然 而 该 模块 只 有 在 日 期 表示 为 从 
' SUNDAY 开始 到 ' SATURDAY 结束 的 连续 的 三 位 数字 时 才能 正常 工作 。 在 习题 9.9 中 我 们 尝试 
编写 一 个 更 加 通用 的 版 本 ， 使 得 无 论 星 期 几 用 任何 形式 表示 ， 模 块 都 能 正常 工作 。 


module NextDayOfWeek (today, tomorrow) ; 
input [2:0] today ; 


output [2:0] tomorrow ; 


assign tomorrow = (today == ‘SATURDAY) ? ‘SUNDAY : today + 3’dl ; 
endmodule 


图 9-5 Verilog 编程 实现 Next DayOfWeek 模块 ， 增 加 了 星期 几 功 能 





图 9-6 给 出 了 计算 给 定 月 份 天 数 的 Verilog 模块 。 该 模块 用 一 条 简单 的 case 语句 实现 ， 
用 default 分 支 来 处 理 一 个 月 有 31 天 的 情况 。 如 果 我 们 将 月 的 名 称 定义 为 常量 ， 可 以 提高 
程序 的 可 读 性 。 然 而 ， 日 常生 活 中 用 数字 表示 月 份 就 足够 了 ,在 这 里 我 们 使 用 数字 表示 
月 份 。 

细心 的 读者 会 发 现 DaysInMonth 模块 并 不 完全 正确 。 程 序 没有 考虑 头 年 的 情况 ， 即 闵 年 
二 月 份 天 数 为 29。 我 们 把 它 作 为 习题 (习题 9. 10) 留 给 读者 来 补充 这 种 情况 。 

定义 完 两 个 子 模 块 ， 现 在 我 们 可 以 开发 完整 的 Tomorrow 模块 了 。 图 9-7 给 出 了 完整 的 明 
天 电路 模块 的 程序 。 在 模块 后 边 是 输入 /输出 信号 声明 ， 然 后 实例 化 两 个 子 模 块 。NextDayOf- 
Week 模块 直接 生成 模块 tomorrowDow 的 输出 信号 。 这 也 是 唯一 一 段 使 用 todayDow 输入 信 
号 的 程序 。 星 期 几 函 数 完全 独立 于 月 份 和 月 的 天 数 函 数 。 

接 下 来 ， 电 路 实例 化 DaysInMonth 子 模 块 。 该 子 模块 生成 一 个 内 部 信号 daysInMonth 
对 当前 月 份 的 最 后 一 天 进行 编码 。 接 下 来 Tomorrow 模块 生成 两 个 内 部 信和 号: 如 果 今 天 是 当前 
月 最 后 一 天 则 lastDay 为 真 ， 如 果 当 前 月 是 十 二 月 则 lastMonth 为 真 。 利 用 这 两 个 内 部 信 
号 ， 模 块 通过 assign 语句 使 用 条 件 操作 符 ?: 计算 出 tomorrowMonth 和 上 tomorrowDoM 的 
值 。 如 果 操 作 符 ? 之 前 的 布尔 表达 式 为 真 ， 则 赋值 为 操作 符 : 左边 的 数值 ， 如 果 表 达 式 为 假 ， 
则 赋值 为 右边 的 数值 。 
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module DaysInMonth(month, days) ; 
input [3:0] month ; // 一 年 中 的 月 份 1 = Jan, 12 
output [4:0] days ; // 一 个 月 中 的 天 数 


reg [4:0] days ; 


always @(*) begin 
case (month) 
// 9 月 等 月 份 有 30 天 
// 剩 下 的 所 有 月 份 为 31 天 
// 除了 2 月 份 有 28 天 
4,6,9,11: days = 5d30 ; 
2: days = 5’d28 ; 
default: days = 5'd31 ; 
endcase 
end 
endmodule 


图 9-6 Verilog 编程 实现 计算 不 同年 的 各 月 份 天 数 的 模块 





module Tomorrow(todayMonth, todayDoM, todayDow, 
tomorrowMonth, tomorrowDoM, tomorrowDoW) ; 
input [3:0] todayMonth ; // 今天 
input [4:0] todayDomM ; 
input [2:0] todayDow ; 
output [3:0] tomorrowMonth ; // 明天 
output [4:0] tomorrowDoM ; 
output [2:0] tomorrowDow ; 


// 计算 星期 中 的 下 一 天 
NextDayOfWeek ndow(todayDoW, tomorrowDoW) ; 


// 计算 在 当前 月 中 的 天 数 
wire [4:0] daysInMonth ; 
DaysInMonth dim(todayMonth, daysInMonth) ; 


// 计算 月 份 和 在 月 中 的 天 数 

wire lastDay = (todayDoM == daysInMonth) ; 

wire lastMonth = (todayMonth == ‘DECEMBER) ; 

assign tomorrowMonth = lastDay ? (lastMonth ? ‘JANUARY : todayMonth + 4'd1) 
: todayMonth ; 

assign tomorrowDoM = lastDay ? 5'dl : todayDoM + 5'd1 ; 


endmodule 
图 9-7 Verilog 编程 实现 明天 电路 。 电 路 接收 今天 在 当月 的 日 期 、 月 的 天 数 、 星 期 几 的 格式 ， 以 
相同 的 格式 计算 出 明天 的 日 期 


有 效 验 证 明天 电路 很 具有 挑战 性 。 暴 力 枚 举 所 有 状态 需要 7 年 的 输入 数据 (2555 个 输入 ) 
来 模拟 电路 。 通 过 观察 并 验证 星期 几 函 数 的 独立 性 ， 可 以 将 输入 减少 到 365 个 。 可 以 通过 只 模 
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拟 月 初 和 月 末 来 进一步 压缩 测试 集 。 我 们 还 需要 对 DaysInMonth 模块 进行 单元 测试 ， 保 证 输 
出 每 个 月 正确 的 天 数 。 


9.3 优先 级 仲裁 器 


下 一 个 例子 是 4 输入 优先 级 仲裁 器 ， 该 电路 接收 4 个 输入 信号 ， 输 出 具有 最 高 值 的 输入 信 
号 的 索引 。 如 果 出 现 平局 ， 则 输出 具有 最 高 值 的 索引 中 最 小 的 一 个 。 举 例 说 明 ， 假 设 4 个 输入 
分 别 为 28、32、47、19， 由 于 输入 2 具有 最 高 值 47， 因 此 仲裁 器 会 输出 2。 如 果 4 个 输入 分 别 
为 17、23、19、23 ， 由 于 输入 1 和 3 为 最 高 值 23 并 且 输 入 1 有 最 小 索引 ， 因 此 仲裁 器 将 输 
出 1。 

该 电路 可 以 应 用 在 网 络 设备 中 ,根据 服务 质量 (QoS) 策略 给 每 个 数据 包 打 分 ， 再 根据 分 
数 选择 下 一 个 要 发 送 的 数据 包 。 分 数 最 高 的 数据 包 最 先 发 送 。 在 此 应 用 场景 中 ， 每 个 数据 包 的 
分 数 作为 优先 级 仲裁 器 的 输入 信号 ， 通 过 优先 级 仲裁 器 选择 数据 包 进 行 传输 。 

图 9-8 给 出 了 优先 级 仲裁 器 的 实现 方案 ， 图 9-9 给 出 了 其 Verilog 实现 。 该 实现 通过 淘汰 赛 
机 制 选择 获胜 的 输入 信号 。 在 第 一 轮 比赛 中 ,输入 信号 0 和 1, 输入 信号 2 和 3 分 别 进 行 比较 。 
第 二 轮 比赛 在 第 一 轮 的 获胜 者 之 间 进 行 。 

淘汰 赛 中 的 每 次 比赛 通过 数值 比较 器 〈 见 8.6 节 ) 实现 。 为 了 在 平局 时 支持 小 号 输入 信 
号 ,数值 比较 器 计算 出 信号 clgt0， 如 果 inl > in0 ，clgt0 为 真 。 如 果 出 现 平 局 ， 则 信和 号 
clgt0 为 假 ， 表 明 ind 赢得 了 比赛 。 在 in3 和 ind 之 间 也 进行 相似 的 比较 。 

通过 两 个 2 选 1 多 路 选择 器 ( 见 8.3 节 ) 来 选择 第 二 轮 比赛 对 手 。 每 个 多 路 选择 右 利 用 比 
较 融 的 输出 信号 作为 选择 信号 来 选择 第 一 轮 比赛 的 胜利 者 。 

第 三 个 数值 比较 器 完成 第 二 轮 比赛 ， 即 比较 从 第 一 级 多 路 选择 器 输出 的 两 个 胜利 者 。 第 二 
轮 比 较 器 的 输出 就 是 优先 级 仲裁 器 的 MSB。 如 果 该 信号 为 真 ， 最 后 的 胜利 者 是 in2 或 ind, 
如 果 该 信号 为 假 ， 则 胜利 者 是 in0 或 inl. 

为 了 得 到 优先 级 仲裁 器 输出 的 LSB， 我 们 选择 赢得 第 一 轮 比 赛 的 比较 器 的 输出 。 通 过 由 最 
终 比 较 器 的 输出 信号 控制 的 单数 据 位 宽 2 选 1 多 路 选择 器 来 实现 。 





图 9-8 4 输入 优先 级 仲裁 器 。 该 电路 接收 4 个 输入 信号 ， 输 出 具有 最 大 值 的 输入 信号 的 索引 。 
通过 对 输入 信号 进行 淘汰 赛 发 现 最 高 值 ， 然 后 选择 匹配 结果 来 计算 索引 


138 PZP AA wz we 





4 输入 优先 级 仲裁 器 
输出 最 高 值 输入 的 索引 号 
输入 : 
in0，inl，in2，in3 一 一 n 位 二 进 制 输入 值 
输出 : 
out 一 一 具有 最 高 值 的 输入 信号 的 2 位 索引 号 


我 们 通过 淘汰 赛 来 选择 获胜 者 

在 第 一 轮 比赛 中 in0 对 阵 in1，in2 对 阵 in3 

第 一 轮 的 获胜 者 之 间 进 行 第 二 轮 比 赛 

MSB 来 自 于 最 后 一 轮 比赛 ,， LSB 来 自 于 选中 的 第 一 轮 比赛 


最 后 的 仲裁 结果 偏好 于 索引 号 低 的 输入 信和 号 


module PriorityArbiter(in3, in2, inl, in0, out) 
parameter n = 8 ; // 输入 信号 宽度 
input [n-1:0] in3, in2, inl, in0 ; 
output [1:0] out ; 


wire [n-1:0] matchOwinner, matchlwinner ; 


// 第 一 轮 淘汰 赛 
MagComp #(n) roundOmatchO(inl, ind, clgt0) ; // 比较 in0 和 inl 
MagComp #(n) roundOmatchl(in3, in2, c3gt2) ; // 比较 in2 和 in3 


// 选择 第 一 轮 的 获胜 者 
Mux2 #(n) matcho (in1, in0, {cigt0, “cigt0}, matchOwinner) ; 
Mux2 #(n) matchl(in3, in2, {c3gt2, ~c3gt2}, matchlwinner) ; 


// 比较 round0 的 获胜 者 


MagComp #(n) roundi (matchilwinner, matchOwinner, out[1]) ; 


// 选择 获胜 的 SB 索引 
Mux2 #(1) winningLSB(c3gt2, clgt0, {out[1], ~out[1]}, out[0]) ; 
endmodule 





图 9-9 Verilog 编程 实现 4 输入 优先 级 仲裁 器 


9.4 JEP AER 


在 这 一 节 中 我 们 开发 一 个 能 玩 井 字 棋 游 戏 的 组 合 电 路 。 给 定 起 始 棋 盘 位 置 ， 程 序 选择 下 一 
步 棋 的 位 置 。 作 为 一 个 组 合 电 路 ， 该 程序 只 能 完成 一 步 棋 。 然 而 ,我 们 能 够 很 容易 将 它 转换 成 
时 序 电路 ( 见 第 14 章 ) 来 完成 整个 游戏 。 时 序 电路 版 本 的 井 字 棋 游 戏 见 19. 3 节 。 

首先 我 们 要 决定 如 何 表示 棋盘 。 我 们 将 输入 棋盘 的 位 置 表示 为 两 个 9 位 向 量 : xin 表示 X 
的 位 置 ，oin 表示 0 的 位 置 。 我 们 将 每 个 9 位 向 量 映射 到 棋盘 上 ， 如 图 9-10a 所 示 。 左 上 和 角 是 
LSB 右 下 角 是 MSB。 例 如 ， 图 9-10b 给 出 的 棋盘 表示 xin = 100000001, oin =000110000 ( 原 书 有 
误 一 一 译 者 注 ) 。 对 于 一 个 合法 的 棋盘 位 置 ，xin 和 oin 必须 是 正 交 垂直 的 ， 即 xin*oin =0。 

严格 意义 上 讲 ， 作 为 棋 手 X， 合 法 的 棋盘 还 应 该 满足 N. +12> N, >N, , HEF N, 是 oin 中 
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位 组 的 数量 ，Nx 是 xin 中 位 组 的 数量 。 如 果 X 先 走 ， 两 个 输入 应 该 一 直 有 相同 数量 的 位 组 。 
如 果 0 先 走 ， 那 么 oin 中 的 位 组 总 比 xin 中 的 位 组 


多 一 个 。 011 2 X 

通常 输出 信号 xout 是 一 个 9 位 的 独 热 码 向 量 ， 3 5 O 
表示 井 字 棋 游戏 电路 将 要 在 哪个 位 置 下 覃 。 合法 的 6 7 8 x a 
下 法 必须 是 跟 输入 向 量 垂直 正 交 。 接 下 来 ， 之 前 的 ë 195 


xin 和 xout 相 或 以 后 代替 之 前 的 xin， 对 手 则 使 ú 
oin 增加 一 位 。 图 9-10 站 a) 

到 目前 为 止 我 们 已 经 表示 了 棋盘 ， 下 一 步 我 们 a a eiga 
将 构造 我 们 的 电路 。 一 种 有 用 的 结构 是 利用 分 而 治 aitoo ( 原 书 有 误 __ 译 者 注 ) 
之 的 方法 ， 作 为 一 组 有 序 策 略 模块 ， 每 个 模块 应 用 表示 
策略 生成 下 一 步 棋 走 法 。 然 后 最 高 优先 级 的 模块 生 
成 的 下 一 步 棋 走 法 被 选中 。 例 如 ， 一 个 好 的 策略 模块 集合 满足 以 下 几 点 : 

1) 获胜 : 如 果 一 步 棋 使 得 某 一 方 三 个 棋子 连 成 一 排 ， 则 该 方 获胜 。 

2) 不 失败 : 如 果 一 步 棋 能 够 阻止 对 方 两 个 模子 连 成 一 排 ， 则 不 会 失败 。 

3) 选择 第 一 个 空格 : 以 特定 顺序 遍历 棋盘 ， 选 择 第 一 个 空格 。 

从 我 们 的 模块 中 选择 电路 组 合 输入 信号 并 选择 最 高 优先 级 模块 的 输出 信号 。 通 过 模块 化 设 
计 ， 以 后 我 们 可 以 很 容易 增加 更 多 的 策略 模块 来 完善 电路 功能 。 

井 字 棋 游戏 移动 生成 器 的 顶层 模块 如 图 9-11 所 示 。 该 模块 的 Verilog 程序 如 图 9-12 所 示 。 
该 程序 实例 化 4 个 模块 : 两 个 TwoInarray 实例 、 一 个 Empty 实例 和 一 个 Select3 实例 。 第 
一 个 TwoInArray 模块 查找 能 够 使 我 们 赢得 比赛 的 位 置 ， 如 果 有 ， 我 们 将 模 下 到 这 个 位 置 ， 
这 个 位 置 和 两 个 X 连 成 一 行 、 一 列 或 对 角 线 ， 在 这 个 行 、 列 或 对 角 线 上 没有 0。 第 二 个 
TwoInArray 模块 查找 这 样 的 位 置 ， 如 果 我 们 这 一 步 不 走 这 个 位 置 对 方 下 一 步 走 这 个 位 置 将 赢 
得 比赛 ， 即 一 行 、 一 列 或 对 角 线 有 两 个 0 而 没有 X 的 位 置 。 我 们 在 获胜 和 阻止 获胜 策略 使 用 
相同 的 模块 ， 因 为 它们 需要 同样 的 功能 ， 只 是 将 X 和 0 其 倒 一 下 。 下 一 个 模块 Empty 根据 特 
定 的 顺序 查找 第 一 个 空格 。 按 照 策略 价值 排序 选择 空格 。 最 后 ， 模 块 Select3 需要 前 面 模块 
的 三 个 输出 来 选择 最 高 优先 级 的 步骤 。 





图 9-11 井 字 棋 游戏 模块 的 高 级 设计 。3 个 策略 模块 接收 输入 信号 xin Moin, 计算 可 能 获胜 
的 下 棋 步 又 ， 不 失败 的 步骤 ， 选 择 一 个 空格 。 然 后 Select3 模块 选择 这 些 可 能 步骤 
中 优先 级 最 高 的 一 个 来 移动 棋子 
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TicTacToe 
在 井 字 棋 游戏 中 为 X 方 生成 一 个 下 棋 步 又 
输入 : 

xin oin 当前 X 和 0 的 位 置 (9 位) 
输出 : 

xout 一 一 X 方 下 一 个 热门 位 置 (9 位 ) 


输入 输出 用 一 个 棋盘 映射 : 


顶层 电路 实例 化 策略 模块 和 选择 器 模块 ， 每 个 策略 模块 根据 策略 生成 一 个 下 棋 步 骤 ， 
选择 器 模块 选择 最 高 优先 级 策略 模块 来 下 下 一 步 棋 
获胜 模块 选择 一 个 空格 下 棋 ， 如 果 存 在 这 样 的 空格 则 会 赢得 比赛 


阻止 模块 选择 一 个 空格 下 棋 ， 这 样 将 阻止 对 方 赢得 比赛 

空 策略 模块 通过 特定 的 查找 顺序 查找 第 一 个 空格 
module TicTacToe(xin, oin, xout) ; 

input [8:0] xin, oin ; 


output [8:0] xout ; 
wire [8:0] win, block, empty ; 


TwolnArray winx(xin, oin, win) ; // 如 果 可 以 就 获胜 

TwoInArray blockx(oin, xin, block) ; // 阻止 0 方 获胜 

Empty emptyx(~(oin | xin), empty) ; // 否则 选择 一 个 空格 

Select3 comb(win, block, empty, xout) ; // 选择 最 高 优先 级 
endmodule 





图 9-12 Verilog 编程 实现 井 字 格 移动 发 生 器 的 顶层 电路 


井 字模 游戏 实现 的 主要 工作 由 图 9-13 给 出 的 TwoInarray 模块 完成 。 该 模块 创建 8 个 
TwoInRow 模块 实例 ( 见 图 9-14) 。 每 个 TwoInRow 模块 检查 一 条 线 ( 行 、 列 或 对 角 线 ) 。 如 
果 检 查 的 直线 有 两 位 a 为 真 并 且 没 有 b 为 真 ， 则 在 空格 位 置 生成 一 个 1。 该 模块 包含 3 个 4 输 
ASN], 表示 3 个 位 置 中 的 每 一 个 都 被 检查 到 了 。 需 要 注意 的 是 ,我 们 在 每 个 与 门 仅仅 检测 b 
的 一 个 数据 位 ， 这 是 因为 我 们 假设 输入 是 合法 的 ， 即 如 果 a 的 一 个 数据 位 是 真 ， 则 b 对 应 的 数 
据 位 为 假 。 

3 个 TwoInRow 实例 检测 所 有 行 ， 生 成 一 个 9 位 的 向 量 rows. WR rows 的 某 位 为 真 ， 放 
— a 到 相应 的 空格 就 可 以 完成 一 行 。 同 样 ，3 个 TwoInRow 实例 检测 3 列 中 有 两 位 a 并 且 没 
# b 的 列 ， 生 成 9 位 向 量 结果 cols。 最 后 两 个 TwoInRow 实例 检测 两 个 对 角 线 ， 生 成 两 个 3 
位 向 量 ddiag 和 uaiag， 分 别 表示 向 下 对 角 线 和 回 上 对 角 线 。 

检测 完 行 、 列 、 对 角 线 之 后 ， 最 后 的 assign 语句 通过 或 操作 将 各 个 组 件 结合 到 一 起 形成 
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TwoInArray 
表示 数组 中 是 否 有 任意 行 或 列 或 对 角 线 上 有 两 个 类 型 a 而 没有 类 型 b 
(a 和 b 可 以 是 x 和 o 或 o 和 x ) 
HA: 
ain, bin 类 型 a 或 b 的 数组 (9 位 ) 
输出 : 
cout 一 一 完成 a 的 行 、 列 或 对 角 线 的 下 棋 的 空格 ( 9 位 ) 
如 果 多 于 一 个 空格 满足 条 件 ， 则 输出 可 以 有 多 个 位 组 
如 果 没 有 空格 满足 条 件 ， 则 输出 全 部 为 0 


module TwoInArray(ain, bin, cout) 
input [8:0] ain, bin ; 
output [8:0] cout ; 


wire [8:0] rows, cols ; 


wire [2:0] ddiag, udiag ; 


// 检查 每 一 行 

TwoInRow topr(ain[2:0],bin[2:0],rows[2 
TwoInRow midr(ain[5:3],bin[5:3],rows([5 
TwoInRow botr(ain[8:6],bin[8:6] ,rows [8 


// 检查 每 一 列 

TwoInRow leftc({ain[6],ain[3],ain[0]}, 
{bin[6],bin[3],bin[0]}, 
{cols [6] ,cols [3] , cols [0] }) 


TwoInRow midc({ain[7],ain[4],ain[1]}, 
{bin[7] ,bin[4] ,bin[1]}, 
{cols [7] ,cols [4] , cols [1] }) 

TwoInRow rightc({ain[8],ain[5],ain[2]}, 
{bin[8],bin[5],bin[2]}, 
{cols [8] ,cols [5] , cols [2] }) 


// 检查 所 有 对 角 线 
TwoInRow dndiagx({ain[8],ain[4],ain[0]},{bin[8],bin[4],bin[0]},ddiag) ; 
TwoInRow updiagx({ain[6],ain[4],ain[2]},{bin[6],bin[4],bin[2]},udiag) ; 


// 所 有 输出 进行 或 运算 
assign cout = rows | cols | 
{ddiag[2],1’b0,1'b0,1'b0,ddiag[1],1'b0,1'b0,1'’b0,ddiag[o]} | 
{1'b0,1'b0,udiag[2],1’b0,udiag[1],1'b0,udiag[0],1'b0,1’bo} ; 
endmodule 





图 9-13 Verilog 编程 实现 TwoInArray 模块 
一 个 单独 的 9 位 结果 向 量 。 向 量 rows 和 cols 直接 组 合 。3 位 的 对 角 线 向 量 首先 扩展 成 9 位 ， 
将 活动 位 放 到 合适 的 位 置 。 

图 9-15 给 出 的 Empty 模块 用 了 一 个 仲裁 器 (DL 8.5 节 ) 在 输入 向 量 中 查找 第 一 个 非 零 
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// TwoInRow 

// 表示 是 否 有 一 行 〈 或 列 或 对 角 线 ) 上 有 两 个 类 型 a 而 没有 类 型 b 
// (a 和 b 可 以 是 x 和 0 或 0O 和 xX) 

// 输入 : 

// ain，bin 一 一 类 型 a 或 b 的 行 (3 位 ) 

// 输出 : 

// ”cout 一 一 其 他 两 个 是 类 型 a 的 空格 位 置 (3 位) 


module TwoInRow(ain, bin, 
input [2:0] ain, bin ; 
output [2:0] cout ; 





assign cout [0] “bin[0] & “ain[0] & ain[1] & ain[2] ; 
assign cout [1] “bin[1] & ain[0] & ~ain[1] & ain[2] ; 
assign cout [2] “bin[2] & ain[0] & ain[1] & “ain[2] ; 
endmodule 
图 9-14 Verilog 编程 实现 TwoTnRow 模块 。 该 模块 在 某 行 的 空位 置 输出 1， 该 行 有 a 的 两 个 数据 位 而 
BA b 的 数据 位 


位 。 需 要 注意 的 是 ， 项 层 模 块 已 经 将 两 个 输入 向 量 或 在 了 一 起 并 补足 了 缺失 位 ， 因 此 这 个 模块 
的 输入 信和 号 的 每 一 位 都 对 应 一 个 空格 。 输 入 向 量 使 用 连接 语句 按照 我 们 想 要 的 优先 级 顺序 (中 
间 优 先 级 最 高 ， 然 后 是 4 个 角 ， 最 后 是 边 ) 进行 排队 。 输 出 以 同样 的 顺序 排队 来 保持 一 致 性 。 


// 检查 输入 信号 没有 的 第 一 个 空格 

// 排列 向 量 使 用 中 间 位 置 在 最 前 边 ， 然 后 是 角 ， 最 后 是 边 
// 输入 : 

ff tn 已 占用 的 格 (94%) 

// 输出 : 

// ”out 一 一 第 一 个 空格 (9 位 ) 


module Empty(in, out) ; 


input [8:0] in ; 
output [8:0] out ; 


RArb #(9) ra({in[4],in[0],in[2],in[6],in[8],in{1],in[3],in{[5],in[7]}, 
{out [4] ,out [0] , out [2] ,out [6] , out [8], out [1] , out [3] , out [5] , out [7] }) ç 





endmodule 


图 9-15 Verilog 编程 实现 Empty 模块 。 该 模块 用 仲裁 器 来 查找 第 一 个 空位 置 ， 首 先 查找 中 间 位 置 ， 
然后 查找 4 个 角 ， 最 后 查找 4 个 边 
图 9-16 给 出 的 Select3 模块 也 仅仅 是 一 个 仲裁 器 。 在 这 种 情况 下 ， 一 个 27 位 的 仲裁 器 
扫描 所 有 三 个 输入 信号 来 查找 第 一 位 。 这 样 既 选 择 最 高 优先 级 的 非 零 输 入 ， 又 选择 了 这 个 输入 
的 第 一 个 组 位 。 仲 裁 器 27 位 的 输出 通过 或 操作 减少 到 9 位 来 和 每 个 输入 保持 一 致 。 
值得 指出 的 是 ， 整 个 井 字 棋 模块 的 底层 仅仅 由 两 个 模块 类 型 TwoInRow 和 RArb 构建 而 
成 。 这 充分 论证 了 组 合 电路 基础 单元 的 通用 性 。 
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Select3 
从 3 个 9 位 向 量 中 选择 优先 级 最 高 的 位 
输入 : 
a, b, c—# À WE (9 位 ) 
输出 : 
out 一 一 独 热 输出 组 位 ， 在 最 高 优先 级 输入 的 最 高 位 (9 位 ) 


module Select3(a, b, c, 
input [8:0] a, D, €}? 
output [8:0] out ; 
wire [26:0] x ; 


RArb #(27) ra({a,b,c},x) 


assign out = x[26:18] | x[17:9] | x[8:0] ; 


endmodule 


图 9-16 Verilog 编程 实现 Select 模块 。 用 一 个 27 输入 仲裁 器 查找 最 高 优先 级 策略 模块 的 第 
一 个 组 位 。 通 过 一 个 三 路 或 电路 生成 仲裁 器 的 输出 信号 
图 9-17 给 出 了 井 字 棋 游戏 模块 的 一 个 简单 测试 平台 。 该 测试 平台 实例 化 了 两 个 TicTac- 
Toe 模块 。 一 个 作为 X 方 ， 男 一 个 作为 0 方 。 测 试 平台 首先 检测 X 方 模块 ， 在 测试 平台 中 称 
为 aut ， 进 行 一 些 直接 测试 。5 个 向 量 检测 空格 、 获 胜 、 阻 止 获胜 策略 ， 并 且 检 测 行 、 列 、 对 
角 线 的 模式 。 





module TestTic ; 
reg [8:0] xin, oin ; 


wire [8:0] xout, oout ; 


TicTacToe dut(xin, oin, xout) ; 


TicTacToe opponent (oin, xin, oout) ; 


initial begin 
// 所 有 位 为 0， 应 该 选择 中 间 位 置 
xin = Ü ; Oim = Ol 7 
#100 Sdisplay("%b %b -> %b", xin, oin, 
// 穿 过 顶端 能 获胜 
sity BLO z cin = Ü ; 
#100 Sdisplay("%b %b -> %b", xin, oin, 
// 接近 获胜 : 根据 阻止 策略 。 穿 越 顶端 不 能 获胜 
xin = 9/5101 ; in = 9:b5010 ; 
#100 Sdisplay("%b %b -> %b", xin, oin, 
// 在 第 一 列 阻 止 
xin = 0 ; oin = 9’b100100 ; 
#100 Sdisplay("%b %b -> %b", xin, oin, 


图 9-17” 井 字 棋 游戏 模块 的 Verilog 测试 平台 。 执 行 直 接 测试 然后 进行 一 个 模块 对 阵 另 一 个 模块 的 游戏 
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// 沿 着 对 角 线 阻止 
xin = 0 ; Oa = 
// 游戏 开始 ，x 方 先 走 
xin = 0 £ cin = 0 ; 
repeat (6) begin 

#100 

S$display ("th th Sh", 


$display("th th th", 
$display("%th %h %h", 


S$display("") ; 
xin = 
#100 

Sdisplay("th th th", 
S$display("th th th", 
Sdisplay("%th th th", 


组 全 远大 


(xout | xin) ; 


9'b010100 ; 
#100 $display("%b %b -> %b", xin, 


{xin [0] 
{xin [3] 
{xin [6] 


{xin [0] 
{xin [3] 
{xin [6] 





oin, xout) ; 


,oin[0]},{xin[1] 
,oin[3]},{xin[4] 
,oin[6]}, {xin[7] 


,oin(0]}, {xin[1] 
,oin[3]},{xin[4] 
,oin[6]}, {xin [7] 


,oin{1]},{xin[2] 
,oin[4] }, {xin [5] 
,oin[7] }, {xin[8] 


,oin[1])}, {xin[2] 
,oin[4]},{xin[5] 
,oin[7]}, {xin[8] 


,oin[2]}) ; 
,oin[5] }) i 
,oin[8] }) ; 


,oin[2]}) ; 
,oin[S]}) ; 
,oin[8]}) ; 


Sdisplay(" ") ; 

oin = (oout | oin) ; 
end 

end 


endmodule 





图 9-17 (4) 


在 5 个 定向 模式 测试 之 后 ， 测 试 平台 通过 将 每 个 模块 的 输出 结果 和 输入 信号 进行 或 操作 来 
[200] 生成 下 一 轮 比 赛 的 输入 信号 ， 从 而 完成 一 轮 完整 的 井 字 棋 游戏 。 游 戏 结果 如 图 9-18 所 示 OÑ 
过 编写 脚本 程序 输出 $ display 语句 内 容 来 获得 游戏 结果 ) 。 





图 9-18 ”执行 一 个 井 字 棋 模块 对 阵 另 一 个 井 字 棋 模 块 的 结果 


游戏 从 空 棋盘 开始 。empty 策略 使 得 X 方 第 一 步 棋 下 到 中 心 位 置 ， 即 最 高 优先 级 的 空格 。 
接 下 来 两 轮 同样 适用 empty 规则 ，0 方 和 X 方 将 棋 下 到 顶部 的 两 个 角 上 。 这 时 X 方 有 两 个 棋子 
排 成 一 行 ， 因 此 适用 block 规则 ，0 方 将 棋 下 到 棋盘 的 左下 角 (位 置 6)， 图 9-18 第 一 行 完成 。 

图 9-18 的 第 二 行 开 始 适用 于 block 规则 ， 使 得 X 方 将 棋 下 到 左 侧 边 位 置 (位 置 3) ; 然后 0 
方 在 中 间 一 行 阻挡 X。 这 时 候 empty 规则 使 得 X 将 棋 下 到 最 后 一 个 角 的 位 置 。 最 后 两 步 ，empty 
规则 使 0 方 和 X 方 依次 下 到 剩余 两 个 空格 中 。 这 局 棋 以 平局 结束 。 

该 测试 平台 执行 的 验证 绝 不 足以 完全 验证 模块 的 操作 。 许 多 输入 组 合 没 有 测试 到 。 测 试 器 
需要 对 模块 进行 完全 测试 。 这 项 工作 通常 通过 高 级 编程 语言 实现 (如 C)， 并 且 为 仿真 器 提供 
接口 。 全 部 操作 将 通过 对 仿真 结果 和 高 级 语言 模块 进行 比较 来 完成 。 希 望 同样 的 错误 不 要 在 两 
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个 模型 中 都 出 现 。 

一 旦 测试 器 布置 到 位 ， 我 们 仍 需要 选择 测试 向 量 。 在 更 多 的 直接 测试 之 后 〈 例 如 测试 所 有 
8 条 线 上 的 获胜 、 阻 止 、 即 将 获胜 、 即 将 阻止 ) ， 我 们 可 以 采取 两 种 方法 。 我 们 可 以 穷尽 测试 
模块 〈 这 里 有 2 “种 输入 情况 ) 。 这 取决 于 我 们 的 仿真 器 有 多 快 ， 我 们 可 能 有 时 间 去 尝试 这 样 测 
试 。 另 外 ， 如 果 没 有 足够 时 间 进 行 穷尽 测试 ， 我 们 可 以 采用 随机 测试 ， 任 意 生 成 输入 信和 号 组 合 


小 结 


在 这 一 章 我 们 学 习 了 4 个 扩展 实例 ， 这 4 个 例子 汇集 了 很 多 到 目前 为 止 在 本 书 学 到 的 知识 
点 。3 的 倍数 电路 是 迭代 电路 的 实例 。 该 电路 由 8 个 Multiple_of_3_bit 模块 构成 ， 每 个 
Multiple_of_3_bit 模块 都 是 由 case 语句 说 明 的 组 合 电路 模块 的 实例 。 该 电路 的 顶层 模块 
是 结构 化 Verilog 编程 的 很 好 的 实例 。 该 电路 的 测试 平台 完成 穷尽 测试 并 且 具 有 自 检 功 能 。 

明天 电路 实现 1.4 节 中 详细 说 明 的 功能 ， 即 给 定 今天 的 日 期 和 星期 几 作 为 输入 ， 计 算出 明 
天 的 日 期 和 星期 几 。 该 电路 的 子 模块 给 出 了 用 case 和 design 一 起 定义 组 合 电 路 模块 的 实 
例 。 顶 层 模块 用 于 实例 化 和 连接 子 模块 ， 它 通过 在 同一 级 使 用 assign 语句 实现 Verilog 混合 
结构 编程 。 

优先 级 仲裁 器 给 出 了 通过 组 成 组 合 电路 基础 单元 来 实现 某 个 功能 的 实例 ， 在 这 个 例子 中 组 
合 电路 基础 单元 有 比较 器 和 多 路 选择 器 。 该 电路 在 输入 信和 号 之 间 举 行 一 场 淘汰 赛 ， 用 比较 器 来 
选择 每 场 比赛 的 获胜 者 ， 然 后 用 多 路 选择 器 按照 某 路 线 将 获胜 者 发 送 到 下 一 轮 比赛 。 

最 后 ， 井 字 棋 游戏 电路 举例 说 明了 如 何 由 简单 电路 构建 成 复杂 功能 电路 ， 以 及 如 何 利 用 分 
而 治之 的 方法 将 复杂 任务 分 解 为 简单 部 分 。 顶 层 电 路 实例 化 策略 模块 ， 然 后 用 仲裁 器 来 选择 最 
高 优先 级 结果 。 反 过 来 说 ， 每 一 个 策略 模块 由 简单 的 逻辑 模块 实现 。 在 底层 ， 整 个 电路 由 仲裁 
器 和 TwoInRow 模块 实现 。 


习题 

91 表决 电路 。 用 像 加 法 器 、 比 较 器 、 多 路 选择 器 、 译 码 器 、 编 码 器 、 仲 裁 器 等 那样 的 组 合 电路 基础 单 
元 和 逻辑 门 电 路 设计 一 个 电路 。 该 电路 接收 5 个 3 位 独 热 码 数字 ， 输 出 其 中 一 个 在 输入 端 出 现 最 多 
的 3 位 独 热 码 数字 。 输 入 信号 之 间 可 以 以 任何 形式 隔 开 。 例 如 ， 如 果 输 入 信号 为 100，100，100， 
010，001， 那 么 将 输出 100。 

9.2 中 间 电 路 。 用 像 加 法 器 、 比 较 器 、 多 路 选择 器 、 译 码 器 、 编 码 器 、 仲 裁 器 等 那样 的 组 合 电路 基础 单 
元 和 逻辑 门 电路 设计 一 个 电路 。 该 电路 接收 3 个 独 热 码 8 位 数字 a2;.。、aly.o。、a371.o。， 输 出 输入 三 个 
数值 中 的 中 间 一 个 。 例 如 ， 如 果 输 入 数值 为 a2 = 10000000, al =00010000, a0 = 00000001。 那 么 输 
出 值 将 为 00010000 ， 即 三 个 热 独 码 数值 的 中 间 一 个 。 

9.3 设计 5 的 倍数 电路 。 用 类 似 于 9.1 节 中 的 3 的 倍数 电路 设计 类 似 的 方法 ， 设 计 一 个 5 的 倍数 电路 ， 
如 果 8 位 输入 信号 数值 为 5 的 倍数 ， 则 电路 输出 真 。 

9.4 ”实现 5 的 倍数 电路 。 用 Verilog 编程 实现 习题 9. 3 中 设计 的 5 的 倍数 电路 ， 并 编写 测试 平台 进行 穷尽 
测试 。 

9.5 设计 10 的 倍数 电路 。 设 计 一 个 电路 ， 如 果 8 位 输入 数值 是 10 的 倍数 ， 则 输出 为 真 。( 提示: 考虑 
要 实现 此 功能 需要 实现 多 少 位 余数 。) 

9.6 实现 10 的 倍数 电路 。 用 Verilog 编程 实现 习题 9. 5 中 设计 的 10 的 倍数 电路 ， 并 编写 测试 平台 进行 穷 
尽 测试 。 

9.7 设计 模 3 电路 。 修 改 9. 1 节 中 3 的 倍数 电路 ， 使 输出 变 为 ing 3 ， 即 输入 信号 以 3 为 模 进 行 计算 。 

9.8 实现 模 3 电路 。 用 Verilog 编程 实现 习题 9.7 中 设计 的 模 3 电路 ， 并 编写 测试 平台 进行 穷尽 测试 。 

9.9 修改 日 历 电 路 ，[ 。 重新 编写 NextDayOfWeek 模块 程序 ， 使 得 该 程序 能 够 接受 任何 形式 定义 的 党 
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9.10 


9.11 


9.12 


9.13 


9.14 


9.15 


9. 16 


9.17 


9.18 


9.19 


9.20 








Ht'SUNDAY, 'MONDAY, +, 'SATURDAY, 
FAAEE, H. DCH BBW, RASA 066 FERETE. Big A fa s t S $, 
用 12 位 二 进 制 表示 。 
日 历 表示 。 设 计 一 个 组 合 逻 辑 电 路 ， 输 入 日 期 从 1 月 1 日 开始 的 天 数 0000， 程 序 返 回 月 中 的 日 期 ， 
即 月 的 天 数 。( 可 选 : 还 可 以 生成 星期 几 格式 。) 
设计 优先 级 仲裁 器 中 的 连接 。9.3 节 中 的 优先 级 仲裁 器 在 同样 结果 下 一 般 以 低 序 号 输入 形式 给 出 
仲裁 结果 。 修 改 电 路 使 得 仲裁 器 在 相同 情况 下 以 高 序号 输入 为 仲裁 结果 。 
实现 优先 级 仲裁 器 中 的 连接 。Verilog 编程 实现 习题 9. 12 的 优先 级 仲裁 器 连接 ， 并 用 选择 的 测试 用 
例 进 行 验证 。 
5 输入 优先 级 仲裁 器 。 修 改 9.3 节 中 的 优先 级 仲裁 器 ， 使 输入 信和 号 增加 为 5 个 。 
8 输入 优先 级 仲裁 器 。 修 改 9. 3 节 中 的 优先 级 仲裁 器 ， 使 输入 信号 增加 为 8 个 。 
反 相 优先 级 。 修 改 9. 3 节 中 的 优先 级 仲裁 器 ， 使 仲裁 结果 选择 值 最 低 的 输入 信号 。 
获胜 值 。 修 改 9. 3 节 中 的 优先 级 仲裁 器 ， 输 出 仲裁 获胜 的 输入 信号 的 值 。 
井 字 棋 游戏 策略 ， 工 。 对 9.4 节 的 井 字 棋 游 戏 模块 进行 扩展 ， 增 加 策略 模块 ， 使 得 将 棋 下 到 某 个 
空格 可 以 使 某 方 两 个 棋子 连 成 一 条 直线 。 创 建 模块 oneInARow， 查 找 有 一 个 X 但 是 没有 0 的 行 、 
列 、 对 角 线 。 利 用 此 模块 构建 一 个 模块 oneInarray 来 实现 此 策略 。 
井 字 棋 游戏 策略 ， 开 。 对 9.4 节 的 井 字 棋 游戏 模块 进行 扩展 ， 增 加 策略 模块 ， 使 得 在 空 棋 盘 上 ， 
将 棋 下 到 位 置 0 (左上 角 )。 
并 字 棋 游戏 策略 ， 亚 。 对 9.4 节 的 井 字模 游戏 模块 进行 扩展 ， 增 加 策略 模块 ,使 得 当 棋盘 上 只 有 
对 方 0 占据 了 两 个 对 角 ，X 占据 了 中 间 位 置 ， 其 他 地 方 都 是 空 的 ， 下 棋 策 略 使 得 X 方 将 模 下 到 相 
邻 边 的 位 置 。( 即将 棋 下 到 下 图 中 H 所 示 的 位 置 。S ) 
Oss 
HX. 

, Q 


井 字 棋 游戏 输入 检测 。 在 井 字 棋 游戏 模块 中 增加 一 个 模块 ， 用 来 检测 输入 是 否 合法 。 

井 字 棋 游戏 结束 。 在 井 字 棋 游 戏 模块 中 增加 一 个 模块 ， 当 比赛 结束 时 输出 一 个 信号 表示 比赛 结果 。 
该 信号 应 该 设置 这 些 编码 项 : 比赛 中 、 获 胜 、 失 败 、 平 局 。 

验证 。 为 井 字 棋 游戏 模块 构建 一 个 检测 器 ， 编 写 测试 平台 对 该 模块 进行 随机 测试 。 


日 ”在 这 种 情况 下 ， 如 果 你 将 棋 下 到 角落 的 位 置 ， 那么 你 的 对 手 0 将 在 两 步 棋 之 后 赢得 比赛 。 
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很 多 数字 系统 对 数 进行 操作 ， 完 成 诸如 加 法 和 乘法 的 算术 运算 。 例 如 ， 数 字音 频 系统 利用 
数列 来 表示 一 个 波形 ， 并 且 执 行 滤波 和 缩放 的 算术 运算 。 

数字 系统 内 部 以 二 进 制 的 形式 表示 数 。 包 括 加 法 和 乘法 在 内 的 二 进 制 算术 运算 函数 通过 组 
合 逻辑 功能 来 完成 。 在 本 章 中 ， 我 们 介绍 正 整 数 和 负 整 数 的 二 进 制 表示 方法 ， 并 构建 用 于 简单 
的 加 法 、 减 法 、 乘 法 和 除法 运算 的 逻辑 电路 。 在 第 11 章 ， 我 们 通过 着 眼 于 近似 实数 的 浮 点 数 
的 表示 方法 来 详 述 这 些 基 础 。 在 第 12 章 , 我们 着 眼 于 快速 算术 运算 的 方法 。 最 后 ， 第 13 章 给 
出 了 使 用 这 些 算术 运算 的 几 个 设计 实例 。 


10.1 二 进 制 数 


作为 人 类 ， 我 们 习惯 用 十 进 制 或 者 以 10 为 基数 的 记 数 法 来 表示 数 。 也 就 是 说 ， 我 们 使 用 
进位 制 记 数 法 ， 其 中 每 位 数 用 其 右边 的 数 的 权重 的 10 倍 进行 加 权 。 例 如 ，1234,。( 下 标 表 示 以 
10 为 基数 ) 表示 1 x 1000 +2 x100+3 x10+4。 我 们 用 十 进 制 系统 很 可 能 是 因为 我 们 有 10 根 
手指 可 以 计数 。 

在 数字 电子 中 ,我们 没有 10 根 手 指 , 但 我 们 有 两 个 状态 一 一 1 和 0， 用 它 来 表示 数值 。 因 
此 ,虽然 计算 机 可 以 (有 了 时 确实 是 ) 以 10 为 基数 (十进制 ) 来 表示 数 ， 但 更 顺理成章 的 是 以 
2 为 基数 或 者 二 进 制 记 数 法 来 表示 数 。 用 二 进 制 记 数 法 ， 每 位 数 用 其 右边 的 数 的 权重 的 2 倍 进 
行 加 权 。 例 如 ，1011，( 下 标 表示 以 2 为 基数 ) 表示 1 x8 +0x4+1x2+1=1li。 

更 正式 地 讲 ， 以 5 为 基数 表示 的 数 anis anas s Qis ao, ERUEN: 


v= Sabi (10-1) 
IITON, b=2, RTT E] 
v = Faz (10-2) 
第 c，, 位 是 二 进 制 表示 法 的 最 左边 或 最 高 有 效 位 (MSB), 第 a, 位 是 最 右边 或 最 低 有 效 位 
(LSB) 。 
我 们 可 以 根据 目标 进 制 按照 公式 (10-1) 或 者 公式 (10-2) ， 将 一 种 进 制 转换 为 另 一 种 进 
制 ， 如 我 们 上 面 将 1011, 转换 为 11o 一 样 。 十 进 制 转换 为 二 进 制 就 可 采用 这 种 方法 。 例 如 ， 
1234,, = 1 x 1111101000, + 10, x 1100100, + 11, x 1010, + 100, x 1 = 1111101000, + 11001000, + 
11110, +100, =10011010010,。 但 是 ,这 个 过 程 有 些 繁琐 需要 大 量 的 二 进 制 计算 。 
通常 ， 更 方便 的 是 重复 减 去 小 于 这 个 数 的 2 RE, Pe Be HG HE 2 的 寡 来 构成 一 个 以 
2 为 基数 的 表达 式 。 例 如 ， 在 公式 (10-3) 中 我 们 将 1234o 转 换 为 二 进 制 。 在 左边 一 列 中 , 我 
们 从 1234,。 开 始 ， 并 重复 地 减 去 小 于 余数 的 2 的 最 大 需 。 每 次 我 们 从 左边 一 列 中 减 去 一 个 数 
值 ， 我 们 在 右边 一 列 中 又 加 相同 的 数 ， 但 采用 的 是 二 进 制 表 示 法 。 在 公式 底部 ， 左 边 一 列 为 
0; 我 们 已 经 减 去 1234o 整 个 值 ， 右 边 一 列 是 10011010010, ， 即 1234,o 的 二 进 制 表示 。 我 们 在 此 
HPRH T 1234,o 的 整个 值 ， 每 次 一 位 。 


RIF HEEB 149 





1234,, 0, 
- 1024,, + 10 000 000 000, 
210,, 10 000 000 000, 
-128， + 10 000 000, 
82,, 10 010 000 000, 

- 64,, + 1 000 000, 
18,, 10 011 000 000, 














— 16, + 10 000, 
2,, 10011 010 000, 
= 2o + 10, 





O, 10 011 010 010, (10-3) 


因为 二 进 制 数 可 能 很 长 ， 表 示 一 个 4 位 的 十 进 制 数 可 能 需要 11 位 二 进 制 数 ， 我 们 有 时 用 
十 六 进 制 或 是 以 16 为 基数 的 记 数 法 。 因 为 16 =24， 所 以 二 进 制 和 十 六 进 制 之 间 转 换 很 容易 。 
我 们 简单 地 将 二 进 制 数 分 解 成 4 位 的 数据 块 ， 然 后 将 每 个 数据 块 转换 为 十 六 进 制 。 例 如 ， 
1234,o 可 表示 为 10011010010; 以 及 4D2,s。 如 下 所 示 ， 我 们 简单 地 从 右 至 左 取 10011010010, 每 4 
位 一 组 ， 然 后 将 每 组 都 转换 为 十 六 进 制 。 我 们 使 用 字母 A ~F 分 别 表示 值 为 10 ~ 15 的 单个 数 
字 。4D2,s 中 的 字母 D 意味 着 第 二 位 数字 (权重 为 16) 的 值 为 13。 

0100 1101 0010 2 

4 D 2 16 
数字 系统 使 用 二 进 制 编码 的 十 进 制 数 (二 - 十进制 编码 ) 或 BCD 表示 来 编码 十 进 制 数 。 

这 是 一 种 每 一 位 十 进 制 数字 由 4 位 二 进 制 数 表示 的 表示 法 。 在 BCD 中 ， 值 由 下 式 给 出 : 


(10-4) 


v= F d, 10' (10-5) 
= Y (10 x > 4,2’) (10-6) 


也 就 是 说 ， 每 一 个 4 位 的 十 进 制 组 & 用 10 A EAT IA, FF EA d, 内 的 每 一 个 二 进 制 
数位 a, LA 2 的 需 进 行 加 权 。 例 如 ， 数 1234, =0001001000110100,,.,, o 
l 2 3 4 10 
0001 0010 0011 0100 BCD 
我 们 使 用 二 进 制 记 数 法 表示 数字 系统 中 的 数 的 原因 是 ， 它 使 得 常见 的 操作 ( 加法、 减法、 
乘法 等 ) 容易 执行 。 一 如 既往 ， 我 们 会 选择 适合 手边 任务 的 表示 法 。 如 果 我 们 有 一 组 不 同 的 操 
作 要 执行 ,我们 可 能 会 选择 一 个 不 同 的 表示 法 。 
例 10-1 二 进 制 转换 
将 数 5961 转换 为 以 下 记 数 法 : 二 进 制 ， 十 六 进 制 ，BCD。 
我 们 可 以 按照 与 公式 (10-3) 中 相同 的 方法 将 其 转换 为 二 进 制 。 答 案 总 共有 13 位 : 
5961 0, 
— 4096, + 1 000 000 000 000, 
1865,, 1 000 000 000 000, 
— 1024,, + 10 000 000 000, 
841,, 1 010 000 000 000, 
— 512, + 1 000 000 000, 
3299, 1011 000 000 000, 


(10-7) 
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~ 256, + 100 000 000, 
73,, 1 011 100 000 000, 
- 64, + 1 000 000, 
9,, 1011 101 000 000, 
-Si + 1 000, 
1,, 1011 101 001 000, 


= ho l 
Oo 1011 101 001 001, 
数 5961,o 在 二 进 制 中 为 1011101000100,。 为 了 写 出 十 六 进 制 数值 ， 我 们 将 二 进 制 数字 分 为 
4 组 : 
0001 0111 0100 1001 2 
l 7 4 9 16 
最 后 ， 在 BCD 码 中 ， 该 数 变 成 0101 1001 0110 0001, 


10.2 二进制 加 法 


我 们 关心 的 第 一 个 操作 将 是 加 法 。 我 们 做 二 进 制 数 加 法 与 做 十 进 制 数 加 法 采用 同样 的 方 
法 ， 从 右边 开始 ， 每 次 一 位 数字 。 唯 一 的 区 别 是 数字 是 二 进 制 的 ， 而 不 是 十 进 制 的 。 这 实际 上 
明显 简化 了 加 法 ， 因 为 我 们 只 需要 记 住 数字 的 4 种 可 能 的 组 合 〈 而 不 是 100 FP) 。 

要 将 a 和 4b 两 个 二 进 制 位 相 加 ,结果 r 只 有 4 种 可 能 性 ， 如 表 10-1 所 示 。 在 第 一 行 中 ,我 
们 做 加 法 0+0 得 到 r=0。 在 第 二 行 和 第 三 行 中 ， 我 们 做 加 法 0+1 (或 者 等 同 于 1+0) 均 得 到 
r=1。 最 后 ， 在 最 后 一 行 中 ， 如 果 a 和 4b 均 为 1， 我们 将 得 到 r=1 +1 =2。 

为 了 表示 结果 7 的 范围 为 0~2， 需 要 s 和 * 两 个 位 ， 如 表 10-1 所 示 。 最 低 有 效 位 我们 称 
之 为 和 ， 而 最 高 有 效 位 “我们 称 之 为 进位 。( 当 我 们 讨论 多 位 加 法 时 ， 这 些 名 称 的 由 来 很 快 就 
会 变 得 清楚 了 。) 

将 两 个 位 相 加 以 产生 和 (sum) 及 进位 (carry) 的 电路 称 为 半 加 器 。 读 者 会 注意 到 ， 和 的 
真 值 表 与 异 或 门 的 真 值 表 相 同 ， 而 进位 的 真 值 表 恰 恰 是 与 门 的 真 值 表 。 因 此 ， 我 们 可 以 用 这 两 
个 门 电路 来 实现 一 个 半 加 器 ， 如 图 10-1 所 示 。 





图 10-1 半 加 器 : a) 图 形 符号 ; b) 322 
辑 电路 


a c c 
表 10-1 半 加 器 真 值 表 于 加 器 
a b r c s b s b 5 
0 0 0 0 0 
0 1 1 0 1 K k. 
l 0 1 0 l 
1 1 2 1 0 


为 了 处 理 进位 输入 ， 我 们 需要 一 个 能 够 接受 三 个 输入 位 即 a. b 和 cin (用 于 进位 输入 ) 的 
电路 ， 并 能 生成 出 这 些 位 之 和 的 结果 7r。 现 在 7 的 取 值 范围 为 0~3, 但 它 仍然 能 用 两 个 位 即 s 
和 cout (用 于 进位 输出 ) 来 表示 。 将 三 个 权重 相同 的 位 相 加 以 产生 和 及 进位 的 电路 称 为 全 加 
器 ， 该 电路 的 真 值 表 如 表 10-2 所 示 。 

图 10-2 为 全 加 器 电路 图 。 从 表 10-2 中 ,我 们 观察 到 和 输出 (s) 具有 三 输入 异 或 的 真 值 表 
( 即 当 奇数 个 输入 为 真 时 输出 为 真 ) 。 进 位 输出 (cout) 为 真 时 大 多 数 的 输入 都 为 真 〈 三 个 当中 有 
两 个 或 三 个 为 真 ) ， 因 此 可 以 使 用 择 多 电路 (公式 (3-6) ) 来 实现 。 
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3210-2 全 加 器 真 值 表 








敏锐 的 读者 现在 已 经 观察 到 了 加 法 器 电路 实际 上 
就 是 计数 器 。 半 加 器 或 全 加 器 仅 计 取 其 输入 端 上 1 的 4 
个 数 ( 所 有 输入 都 是 等 效 的 ) ， 并 在 其 输出 端 上 以 二 om | 全 加 器 | ， 
进 制 的 形式 记录 该 计数 值 。 对 于 半 加 器 ， 计 数 在 0 ~ 





2 的 范围 内 ， 而 对 于 全 加 器 ， 计 数 范围 为 0 ~3。 a) f | 
我 们 可 以 利用 这 个 计数 特性 用 半 加 器 来 构造 一 个 ”图 10-2 全 加 器 : a) 图 形 符号 ; b) E 
全 加 器 ， 如 图 10-3a 所 示 。 在 该 图 中 ， 括 号 中 的 数字 辑 电路 


表示 信号 的 权重 。 输 入 信号 都 用 1 加 权 ， 结 果 输 出 一 个 二 进 制 数 ， 其 中 和 用 1 加 权 ， 进 位 输出 
用 2 加 权 。 因 为 加 法 器 计 取 的 是 其 所 有 输入 端 上 1 的 个 数 ， 所 以 它们 应 当 具 有 相等 的 权重 ， 否 
则 一 个 输入 端 计 取 的 将 比 男 一 个 输入 端 多 。 我 们 使 用 一 个 半 加 器 计 取 两 个 原始 输入 信号 ， 产 生 
一 个 我 们 称 为 p (用 于 传递 (propagate)) 的 和 以 及 一 个 我 们 称 为 & (用 于 生成 (generate)) 的 
进位 。 如 果 传 递 信号 为 真 ， 进 位 输入 (cin) 中 的 一 位 将 使 进位 输出 变 高 。 也 就 是 说 ， 进 位 输 
入 传递 到 了 进位 输出 。 如 果 生 成 信号 为 真 ， 进 位 输出 将 为 真 ， 而 与 进位 输入 无 关 。 也 就 是 说 a 
Alb 生成 了 进位 输出 。 我 们 将 在 12. 1 节 中 看 到 如 何 使 用 生成 和 传递 信号 来 构建 非常 快速 的 加 
法 器 。 对 于 现在 来 说 ， 我 们 仍 将 继续 我 们 简单 的 加 法 器 。 





图 10-3 ”一 个 全 加 器 可 由 a) 三 个 半 加 器 或 b) 两 个 半 加 器 和 一 个 或 门 构成 。 括 号 里 的 数字 
表示 每 一 个 信号 的 权重 

第 二 个 半 加 器 将 p (权重 为 1) 与 进位 输入 (权重 也 为 1) 相 结合 以 产生 和 输出 (权重 为 1) 
以 及 进位 输出 cp (用 于 传递 进位 ， 权 重 为 2)。 此 时 ,我 们 有 一 个 权重 为 1 的 信号 s 和 两 个 权重 
为 2 的 信号 cp 和 g。 我 们 利用 第 三 个 半 加 器 将 这 两 个 权重 为 2 的 信号 相 结合 ， 第 三 个 半 加 器 的 
和 输出 就 是 进位 输出 (权重 为 2) 。 该 半 加 器 的 进位 输出 (权重 为 4) 未 使 用 。 这 是 因为 ， 仅 有 
三 个 输入 ， 不 会 出 现 4 的 计数 。 

我 们 可 以 通过 利用 以 下 事实 简化 图 10-3a 的 电路 : 我 们 仅 需 要 最 后 一 个 半 加 器 的 和 输 
出 ; @ 最 后 一 个 半 加 器 的 两 个 输入 将 不 会 同时 为 高 。 事 实 @@ 让 我 们 可 以 用 一 个 异 或 门 来 代替 半 
加 器 。 因 为 进位 输出 未 使 用 ， 因 此 不 需要 该 半 加 器 中 的 与 门 。 事 实 @ 让 我 们 可 以 用 一 个 或 门 来 





152 RABY PJ K eK 





代替 异 或 门 (在 CMOS 中 用 一 个 更 简单 的 门 来 实现 ) ， 因 为 它们 的 真 值 表 是 完全 相同 的 ， 除 了 两 
个 输入 同时 为 高 的 状态 。 简 化 的 结果 是 图 10-3b 的 电路 ,该 电路 的 Verilog 描述 如 图 10-4 所 示 。 


module HalfAdder(a,b,c,s) ; 


input a,b ; 


output c,s ; // 进位 及 和 


assign s a b ; 


assign c 
endmodule 


// 全 加 器 一 一 来 自 半 加 器 

module FullAdderl(a,b,cin,cout,s) ; 
input a,b,cin ; 
output cout,s ; // 进位 及 和 
wire g,p ; // 生成 和 传递 
wire cp ; 
HalfAdder hal(a,b,g,p) ; 
HalfAdder ha2(cin,p,cp,s) ; 
assign cout = g | cp; 


endmodule 





图 10-4 由 半 加 器 构成 的 全 加 器 的 Verilog 描述 


图 10-5 显示 了 用 于 全 加 器 的 优化 后 的 CMOS 
逻辑 电路 。 该 电路 由 一 个 反 相 器 和 5 个 CMOS 门 
电路 Q1 ~ Q5 组 成 ， 其 中 包括 2 个 2 输入 与 非 门 
QI 和 Q3， 以 及 3 个 3 输入 或 -与 - 非 (OAI) 门 
Q2、Q4 AI QS. QI 和 Q2 构成 第 一 个 半 加 器 ， 提 
供 作为 补充 的 输出 的 p 和 g。Q3 和 Q4 构成 一 个 
Elak (XNOR) 门 ， 用 作 第 二 个 半 加 器 的 异 或 ， 图 10-5 全 加 器 的 CMOS 门 级 实现 
产生 输出 s。Q5 的 输入 OR 门 〈 低 为 真 与 门 ) 部 分 完成 第 二 个 半 加 器 的 与 门 部 分 。 然 而 ， 不 产 
Æ cp 信和 号， 它 保留 在 了 Q5 的 内 部 。Q5 的 输出 与 门 〈 低 为 真 或 门 ) 部 分 完成 或 门 部 分 ， 用 以 
将 g 与 邑 组 合并 生成 进位 输出 。 I 

通过 以 上 说 明 ， 可 以 看 到 算术 电路 是 如 何 用 CMOS PJ APRS AY, SEI AYA, A Re 
辑 综合 工具 ， 你 无 须 让 运算 电路 工作 在 门 级 电路 上 。 

现在 我 们 有 了 可 以 单位 相 加 的 电路 ， 我 们 可 以 继续 多 位 加 法 。 要 将 多 位 数 相 加 ， 我 们 简单 
地 运用 这 个 单位 二 进 制 加 法 ， 从 右 到 左 每 次 一 位 。 例 如 ， 假 设 我 们 使 用 4 位 二 进 制 数 ， 要 将 
3io (0011) 加 到 6。(0110) 上 ， 我 们 计算 如 下 : 

110 

0110 
+0011 

1001 


我 们 从 最 右边 的 一 列 开始 ， 两 个 LSB 相 加 ， 即 0 + 1， 得 到 1 作为 结果 的 LSB。 结 果 可 以 用 
一 位 来 表示 〈 即 其 小 于 2) ， 所 以 进入 下 一 列 的 进位 〈 由 项 部 一 行 中 的 小 灰色 数字 表示 ) 为 0。 
算 上 进位 ， 我 们 有 3 位 用 于 对 第 二 列 (0、1 和 1) RAM, 结果 为 2， 所 以 和 的 第 二 位 为 0， 并 
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且 我 们 进位 一 个 1 到 第 三 列 的 项 部。 在 第 三 列 中 ,位 为 1、1 和 0， 又 是 两 个 1， 所 以 和 及 进位 
仍 分 别 是 0 和 1。 在 最 后 第 四 列 中 ， 只 有 进位 是 1， 所 以 和 为 1， 进 位 〈 未 显示 ) 为 0。 结 果 为 
0110 +0011 = 1001 或 者 6 +3=9。 


例 10-2 二进制 加 法 
用 二 进 制 完成 以 下 加 法 : 71 ,+5l，。 
首先 ， 我 们 将 数 转换 为 二 进 制 : 71o = 1000111, 和 51,,。=110011。 然 后 ,我们 做 加 法 ( 进 
位 输出 在 顶部 一 行 ， 和 输出 在 底部 ) : 
e 0001110 
1000111 
+ 0110011 
s 1111010 
当 将 答案 转换 回 十 进 制 时 ， 可 以 验证 1111010, =122io。 


我 们 可 以 采用 相同 的 方式 从 全 加 器 构建 一 个 多 位 加 法 器 电路 : 从 LSB 开始 ， 一 直 操作 到 
MSB。 此 种 电路 如 图 10-6 所 示 。 底 部 的 全 加 器 FAO 计算 进位 输入 cin 与 两 个 输入 a, Alb, 的 最 
低 有 效 位 (LSB) 之 和 ,产生 和 的 最 低 有 效 位 (LSB) s 以 及 进 到 第 1 位 的 进位 cu。 对 于 此 位 ， 
我 们 也 可 以 使 用 半 加 器 ; 然而 ， 我 们 选择 使 用 全 加 器 是 为 了 允许 我 们 使 用 进位 输入 。 每 一 个 后 
续 的 全 加 器 位 FA i 计算 进 到 那 一 位 的 进位 c; 与 那 一 位 的 输入 a, Alb, 之 和 ， 以 产生 和 的 那 一 位 
s; 以 及 进 到 下 一 位 的 进位 c. o 

如 果 正 确 设置 输入 〈 对 于 所 有 的 守 ， 恰 好 a, Mb, 中 的 一 个 为 真 ) ， 进 位 将 从 cin 波动 到 
cout。 因 为 传递 通过 所 有 n 个 全 加 器 ， 此 种 电路 通常 被 称 为 行 波 进位 加 法 器 。 对 于 n 比较 大 
(大 于 8) 时 ， 这 可 能 会 很 慢 。 我 们 将 在 12. 1 节 中 看 到 如 何 构 建 一 个 延迟 与 log (n) 而 不 是 nn 
成 比例 的 加 法 器 。 

对 于 大 多 数 应 用 来 说 ， 用 Verilog 描述 一 个 加 法 器 最 合适 的 方法 是 使 用 行为 描述 ， 如 图 10-7 
所 示 。 在 声明 了 输入 和 输出 之 后 ， 这 里 实 实在 在 的 描述 就 是 一 行使 用 “+ ”运算 符 将 单位 的 
cin 与 n 位 的 a 和 b 相 加 。 级 联 的 cout 和 s 作为 输出 结果 。 








cout 


// 多 位 加 法 器 一 一 行为 描述 
module Adderl (a,b,cin,cout,s) ; 
parameter n = 8 ; 
input [n-1:0] a, D ; 
input cin ; 
output [n-1:0] s ; 
output cout ; 


assign {cout, s) = a+b + cin ; 





endmodule 


图 10-6 多 位 二 进 制 加 法 器 图 10-7 多 位 加 法 器 的 Verilog 行为 描述 。 该 描述 使 
用 Verilog 的 “+” 原 语 来 描述 加 法 
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I 
213 





214 





[215] 
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如 这 里 所 示 ， 现 代 综 合 工具 在 行为 描述 方面 做 得 相当 好 ， 并 生成 一 个 非常 高 效 的 逻辑 网 
表 。 事 实 上 ， 许 多 工具 都 带 有 各 种 算术 单元 的 优化 版 本 库 。 不 需要 更 详细 地 描述 加 法 器 了 。 

出 于 例证 的 目的 ， 加 法 器 的 另 一 种 Verilog 描述 如 图 10-8 所 示 。 该 模块 根据 与 、 或 以 及 异 
或 运算 描述 了 行 波 进位 加 法 器 的 逐 位 逻辑 。 该 描述 定义 了 位 的 传播 变量 和 生成 变量 ， 然 后 用 
它们 来 计算 出 进位 。 进 位 的 定义 使 用 级 联 和 子 字 段 规 格 以 使 得 进位 的 第 i 位 是 第 i-1 位 的 函 
数 。 这 不 是 一 个 循环 定义 。 


// 多 位 加 法 器 一 一 逐 位 敢 辑 描述 
module Adder2(a,b,cin,cout,s) ; 
parameter n = 8 ; 
input [n-1:0] a, b ; 
input cin ; 
output [n-1:0] 
output cout ; 


wire [n-1:0] p = a “b ; // 传递 

wire [n-1:0] g = a & b ; // 生成 

wire [n:0] c = {g | (p & c[n-1:0]), cin} ; // 进 位 =g | p & c 
assign s = p ^ c[n-1:0] ; // 求 和 

assign cout = c[n] ; 


endmodule 





10-8 行 波 进位 加 法 器 的 逐 位 逻辑 的 Verilog 描述 


尽管 这 个 描述 对 于 展示 加 法 器 的 逻辑 定义 是 有 用 的 ， 它 可 以 生成 出 一 个 劣 于 图 10-7 的 行 
为 描述 的 逻辑 网 表 。 这 是 因为 综合 工具 可 能 不 会 将 其 识别 为 加 法 器 ， 因 此 不 能 完成 其 特定 的 加 
法 器 综合 。 相 比 之 下 ， 当 使 用 “+ ”运算 符 时 ， 训 无 疑问 所 描述 的 电路 就 是 加 法 器 。 逻 辑 描 
述 也 难以 阅读 和 维护 。 没 有 模块 名 称 、 变 量 名 称 和 注释 ， 你 将 要 研究 学 习 这 个 模块 一 段 时 间 ， 
才能 识别 出 其 功能 。 相 反 , 使 用 了 “+”， 对 于 读者 来 说 ， 能 够 马上 明白 (和 综合 工具 一 样 ) 
你 的 意思 。 

我 们 的 n 位 加 法 器 (图 10-6 ~ 图 10-8) 接收 两 个 n 位 输入 ， 并 产生 一 个 n+1l 位 输出 。 这 
确保 了 我 们 有 足够 的 位 数 来 表示 最 大 可 能 的 和 。 例 如 ， 使 用 3 位 加 法 器 ， 将 二 进 制 的 111 加 到 
111 则 给 出 4 位 的 结果 1110。 然 而 ， 在 很 多 应 用 中 ， 我们 需要 一 个 n 位 的 输出 。 例 如 ， 我 们 可 
能 想 使 用 该 输出 作为 随后 的 输入 。 在 这 些 情况 下 ,我 们 需要 舍弃 进位 输出 而 仅仅 保留 位 的 
和 。 将 自身 限制 到 位 输出 会 加 大 溢出 的 隐患 ， 这 是 当 我 们 计算 的 输出 过 大 而 不 能 用 n 位 表示 
时 就 会 发 生 的 情况 。 

溢出 通常 是 一 种 错误 状态 。 它 能 容易 地 侦 测 到 ; 任何 时 候 进 位 输出 为 1， 则 会 出 现 溢 出 。 大 
多 数 加 法 器 对 溢出 情况 执行 模 运 算 ， 它 们 计算 a+b (mod 2 )。 例 如 ， 使 用 3 位 加 法 器 , 111 + 
010 相 加 给 出 001 (7, +29 =l, (mod 8o) ) 。 在 习题 10. 20 中 ,我 们 将 看 一 个 饱和 加 法 器 ， 在 
溢出 情况 时 它 采 用 不 同 的 方法 产生 输出 。 


10.3 负数 和 减法 


MF n 位 二 进 制 数 ， 使 用 公式 〈10-2) ， 我 们 只 能 表示 最 大 值 为 2 -1 的 非 负 整数 。 我 们 经 常 
将 仅 表示 正 整数 的 二 进 制 数 称 为 无 符号 数 (因为 它们 没有 + 或 -号 )。 在 本 节 中 ,我 们 将 看 到 如 
何 使 用 二 进 制 数 来 表示 正 整 数 和 负 整 数 ， 通 常 称 为 带 符号 数 。 为 了 表示 带 符号 数 ， 我 们 有 三 个 
主要 的 选择 : 2 的 补 码 ( 即 补 码 )、1 的 补 码 〈 即 反 码 ) 和 符号 -数值 码 〈 即 原 码 ) 。 
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从 概念 上 讲 ， 最 简单 的 数 制 是 符号 - 数值 码 。 在 这 里 ， 我 们 可 以 在 这 个 数 上 简单 地 增加 
一 个 符号 位 *， 并 约定 如 果 *=0， 该 数 为 正 数 ， 如 果 *=1， 该 数 为 负数 。 按 照 约定 ， 我 们 将 
符号 位 放置 在 最 左边 (MSB) 人 位置。 考虑 两 个 数 +23,o 和 - 23。 在 符号 - 数值 码 表示 法 中 ， 
+23, =O10111, 并 且 -23,。 =110111,sw。 在 这 两 个 数 之 间 的 变化 就 是 符号 位 。 我 们 的 数值 函数 
变 成 : 


=-1' x Faa (10-8) 


要 得 到 相反 数 的 1 的 补 码 ， 我 们 求 反 该 数 的 所 有 位 。 因此 ， 求 反 我 们 示例 中 的 数 + 23 = 
O1O111,, 我 们 得 到 — 23, = = 101000... 该 数值 函数 变 成 : 


v =-a,_,(2" 41) + F a2! (10-9) 


在 这 里 ,符号 位 a,_, 用 - (2-1) (在 二 进 制 表示 中 为 全 1 的 数字 ， 因 此 名 称 为 1 的 补 码 ) 
加 权 。 

最 后 ， 要 得 到 相反 数 的 2 的 补 码 ， 我 们 求 反 该 数 的 所 有 位 然后 加 1。 对 于 我 们 示例 中 的 数 
+23, =O10111,, -23,, =101001,。 该 数值 函数 变 成 : 


n-2 
v =-a, 2" + > a2 (10-10) 
i=0 


与 1 的 补 码 相 比 ， 符 号 位 的 权重 减少 了 1 ~ -2”'。 

那么 我 们 应 该 在 一 个 给 定 的 系统 中 使 用 这 三 种 格式 中 的 哪 一 种 ? 答案 是 取决 于 系统 。 然 
而 ， 绝 大 多 数 数 字 系 统 采用 2 的 补 码 记 数 制 ， 因 为 它 简化 了 加 法 和 减法 。 我 们 使 用 二 进 制 加 
法 ， 可 以 直接 将 正 数 或 负数 的 2 的 补 码 进行 相 加 ， 并 得 到 正确 的 答案 。 对 于 符号 -数值 码 或 1 
的 补 码 却 不 是 这 样 。 

例如 ， 考 虑 将 +4 和 -3 相 加 以 获得 结果 +1 表示 成 4 位 带 符号 的 二 进 制 数 的 情况 。 针 对 三 种 
记 数 制 ， 该 计算 的 输入 和 输出 展示 在 下 面 。 对 于 2 的 补 码 , 将 +4 (0100) 加 到 -3 (1101) 给 出 
+1 (10001) ， 如 果 我 们 忽略 进位 〈 下 面 会 更 详细 地 讨论 进位 和 溢出 ) ， 答 案 是 正确 的 。 相 反 ， 
仅 将 1 的 补 码 相 加 则 会 得 到 10000 ,2 而 将 符号 -数值 码 相 加 则 得 到 1111.9 

2 的 补 码 ”1 的 补 码 ”符号 - 数值 码 


+4 0100 0100 0100 
-3 1101 1100 1011 
+1 0001 0001 0001 


ATARATA 2 的 补 码 数 使 得 负数 相 加 变 得 更 容易 ， 有 必要 回顾 一 下 我 们 是 如 何 生 成 2 
的 补 码 的 。 我 们 对 位 求 反 然后 加 1。 对 某 数 x 按 位 求 反 得 到 2” -1 -x《〈 对 于 4 位 整数 则 是 15 - 
x) ， 例 如 ，15 -3 =12， 其 在 二 进 制 中 为 1100 (3 的 1 的 补 码 )。x 的 2 的 补 码 比 这 个 再 多 1, 
或 者 是 2" -x (对 于 4 位 整数 则 是 16 -x)，, 例如 ，16 -3 =13 ， 其 在 二 进 制 中 为 1101 (3 的 2 的 
补 码 )。 因 为 所 有 的 加 法 都 是 以 模 2" 完成 的 ， 某 数 的 2 的 补 码 2" -x 与 -x 等 同 。 因 此， 我 们 
可 以 得 到 正确 的 结果 。 回 到 我 们 先前 的 例子 : 

4-3=4+(16-3) (mod 16) = 17 (mod 16) = 1 (10-11) 

在 思考 1 的 补 码 或 2 的 补 码 运算 时 ， 在 一 个 轮 盘 上 可 视 化 这 些 数字 通常 很 有 帮助 ， 如 图 10-9 所 
示 。 这 里 我 们 展示 了 从 0000 (在 12 点 钟 位 置 ) 到 1111 的 4 位 数 ， 顺 时 针 方向 围绕 着 圆 递 增 。 
在 图 10-9a、 图 10-9b 和 图 10-90 中 ,我 们 分 别 展示 了 由 2 的 补 码 、1 的 补 码 和 符号 - 数值 码 分 





© 在 习题 10.33 中 ,我们 看 到 如 何 通过 使 用 循环 进位 来 构建 一 个 1 的 补 码 加 法 器 。 
O 负数 的 符号 -数值 码 加 法 是 通过 先 转换 为 1 的 补 码 或 2 的 补 码 来 完成 的 。 
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配给 这 些 位 组 合 的 数值 。 
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ç 


ooro VY 
r 
-3 s 
1100 
7707 


lo Lo 
ç 
¿Ñ 

ao 





a) 2 的 补 码 b) 1 的 补 码 c) 符号 -数值 码 
图 10-9 数字 轮 盘 展示 了 负数 的 三 种 编码 。a) 2 的 补 码 。b) 1 的 补 码 。e) 符号 -数值 码 


从 图 中 可 以 立即 看 出 的 一 点 是 ，! 的 补 码 和 符号 - 数值 码 中 0 不 具有 唯一 的 表示 。 例 如 ， 
在 1 的 补 码 中 ，0000 和 1111 都 表示 数值 0。 这 使 得 数值 比较 更 加 困难 。 恒 等 比较 器 (DL 8. 6 
节 ) 本 身 不 能 确定 两 个 数 的 1 的 补 码 或 符号 - 数值 码 是 否 相等 ， 因 为 一 个 可 能 是 +0， 另 一 个 
可 能 是 -0。 

更 重要 的 是 ， 这 个 圆圈 让 我 们 理解 了 模 运 算 的 效果 。 将 某 个 数 加 上 — x 具有 沿 着 圆周 顺 时 
针 转 动 16 -x 步 的 效果 ， 它 与 围绕 着 圆周 逆 时 针 转 动 x 步 的 效果 完全 相同 。 例 如 ，-3 等 同 于 
顺 时 针 转 动 13 步 或 逆 时 针 转 动 3 步 ， 因 此 在 -5 和 +7 之 间 的 任何 值 加 上 -3 即 可 得 到 正确 的 
结果 (将 -3 加 到 -6 和 -8 之 间 的 值 会 导致 溢出 ， 因 为 我 们 无 法 表示 小 于 -8 的 结果 ) 。 

在 2 的 补 码 数 相 加 时 ， 我 们 如 何 检测 溢出 ? 我 们 在 上 面 看 到 ， 可 以 生成 一 个 进位 作为 模 运 
算 的 结果 ， 并 能 得 到 一 个 正确 的 答案 。 但 是 ， 我们 仍然 可 以 生成 超出 范围 的 结果 。 例 如 ， 当 我 
们 将 -3 加 上 -6 或 +4 加 上 +4 时 会 发 生 什么 ? 我 们 分 别 得 到 了 +7 和 -8， 两 个 都 错 了 。 我 们 
如 何 检测 这 个 信号 溢出 呢 ? 

这 里 观察 到 的 关键 情况 是 符号 改变 了 。 我 们 总 是 可 以 将 一 个 正 数 加 到 负数 上 (反之 亦 
然 ) ， 并 得 到 范围 内 的 结果 。 溢 出 仅 会 出 现在 : 如 果 我 们 将 两 个 符号 相同 的 数 相 加 ， 且 得 到 一 
个 符号 相反 的 结果 。 因 此 ， 我 们 可 以 通过 比较 输入 和 输出 的 符号 来 检测 溢出 。 

现在 可 以 做 负数 加 法 了 ， 我 们 可 以 构建 一 个 减法 电路 。 一 个 减法 器 接受 两 个 2 的 补 码 a 和 
b 作为 输入 ， 并 且 输 出 4=a - b, 一 个 既 可 以 做 加 法 又 可 以 做 减法 的 电路 如 图 10-10 所 示 。 在 加 
法 模式 下 ，sub 输入 为 低 ， 因 此 经 过 异 或 门 后 输入 不 变 ， 加 法 器 产生 a +b, "4 sub 输入 为 高 
时 ， 异 或 门 对 68 输入 进行 求 反 ,并且 进 到 加 法 器 的 进位 为 高 ， 因 此 加 法 器 产生 a+5b+1 =a-b。 

10-11 展示 了 我 们 的 加 / 减 电路 如 何 用 三 个 门 电 路 来 增加 溢出 检测 。 第 一 个 异 或 门 检测 
两 个 输入 的 符号 是 否 不 同 (sid); 第 二 个 异 或 门 确定 其 中 一 个 输入 的 符号 是 否 不 同 于 输出 的 符 
号 (siod)。 与 门 检查 两 个 输入 的 符号 是 否 相同 (sid =0) 并 且 不 同 于 输出 的 符号 (siod =1)。 
如 果 是 ， 则 发 生 溢出 。 

我 们 可 以 将 溢出 检测 简化 为 单独 的 一 个 异 或 门 ， 如 
10-12 所 示 。 这 种 简化 基于 对 符号 位 的 进位 和 输出 的 观 
察 。 表 10-3 列举 了 6 种 情况 : 输入 同 为 正 、 异 号 或 同 为 ”sub 
负 ， 以 及 进位 输入 是 0 或 是 1。 当 输入 的 符号 不 同 (p=1， 图 10-10 2 的 补 码 加 /减法 单元 





O 我 们 将 在 下 文 看 到 ， 可 以 通过 将 进 到 最 后 一 位 的 进位 与 最 后 一 位 的 进位 输出 进行 比较 来 完成 相同 的 功能 。 








图 10-11 基于 符号 位 比较 进行 溢出 检测 的 2 的 补 码 加 /减法 单元 


g=0) 时 ， 进 到 符号 位 的 进位 将 传递 。 因 此 ， 在 这 种 情况 下 进位 的 输入 和 输出 是 相同 的 。 当 输 [219] 
人 同 为 正 (p=0, g=0) 时 ， 进 到 符号 位 的 进位 标志 着 溢出 ， 并 且 不 会 传递 。 最 后 ， 如 果 输 入 

同 为 负 (g =1) ， 除 非 有 进 到 符号 位 的 进位 ， 否 则 溢出 将 发 生 。 因 此 ， 我 们 看 到 : 如 果 进 到 符 

号 位 的 进位 (cis) 和 符号 位 的 进位 输出 (cos) 不 同 ， 则 会 发 生 溢出 。 





图 10-12 ”基于 最 后 一 位 的 进位 输入 和 输出 进行 溢出 检测 的 2 的 补 码 加 /减法 单元 


表 10-3 针对 加 法 器 的 输入 以 及 进 到 符号 位 的 进位 情况 来 检测 溢出 。 列 显示 了 a 和 bb 的 符号 位 

(as 和 bs)、 进 到 符号 位 的 进位 和 符号 位 进位 输出 (cis 和 cos) 以 及 输出 的 符号 位 
(qs) 。 仅 当 进 到 符号 位 的 进位 和 符号 位 进位 输出 不 同时 才 发 生 洪 出 
bs cis qs cos ovf 说 明 

输入 同 为 正 ， 进 位 同 为 0， 无 溢出 

输入 同 为 正 ， 进 位 输入 为 1， 滋 出 

输入 异 号 ， 进 位 输入 为 0， 无 溢出 

输入 异 号 ， 进 位 输入 为 1， 无 溢出 

输入 同 为 负 ， 进 位 输入 为 0， 浇 出 

输入 同 为 负 ， 进 位 输入 为 1， 无 溢出 
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加 /减法 单元 的 Verilog 代码 如 图 10-13 所 示 。 该 代码 实例 化 了 一 个 用 于 符号 位 相 加 的 1 位 
加 法 器 以 及 一 个 用 于 其 余 位 相 加 的 n - 1 位 加 法 器 。b 输入 与 sub 输入 的 异 或 门 按照 每 个 加 法 
器 的 参数 列表 执行 。 

另 一 种 Verilog 实现 如 图 10-14 所 示 。 该 代码 使 用 带 有 “+ ”运算 符 的 assign 语句 来 代替 实 
例 化 的 预定 义 的 加 法 器 。 它 仍然 在 做 加 法 之 前 对 b 输入 执行 显 式 异 或 操作 。 
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// 做 加 法 a+b 或 做 减法 a-b， 检 查 涪 出 
module AddSub(a,b,sub,s,ovf) ; 


parameter n = 8 ; 


input [n-1:0] a, b ; 

input sub ; // 如 果 sub=1 做 减法 ， 否则 做 加 法 
output [n-1:0] 8 ; 

output ovf ; // 车 溢出 则 为 1 

wire cl, c2 ; // 最 后 两 位 的 进位 输出 


assign ovf = cl ^ c2 ; // 如 果 符 号 不 匹配 ， 滋 出 


// 非 符号 位 相 加 
Adderl #(n-1) ai(a[n-2:0],b[n-2:0]*{n-1{sub}},sub,cl,s[n-2:0]) ; 
// 符号 位 相 加 
Adderl #(1) as(a[n-1],b[n-1]*sub,cl,c2,s[n-1]) ; 
endmodule 





图 10-13 用 于 具有 溢出 检测 的 加 /减法 单元 的 结构 化 Verilog 代码 。 其 实现 实例 化 加 法 器 模块 


有 人 可 能 会 试图 避免 使 用 显 式 异 或 运算 ， 而 是 使 用 下 面 类 似 的 语句 编写 一 个 加 /减法 单元 
(忽略 溢出 ): 


assign (c, s) = sub ? (a - b) : (a +b) ; 


不 要 这 样 做 ! 几乎 所 有 的 综合 系统 都 将 为 这 个 代码 生成 两 个 独立 的 加 法 器: 一 个 做 “ +”， 
另 一 个 做 “ -”。 虽 然 这 段 代码 是 相当 清楚 上 且 容 易 阅 读 的 ， 但 它 不 能 很 好 地 综合 ， 生 成 出 被 葵 
代 版 本 的 两 倍 的 逻辑 。 


// 做 加 法 a+b 或 做 减法 a-b， 检 查 洲 出 
module AddSubl (a,b,sub,s,ovf) ; 
parameter n = 8 ; 
input [n-1:0] a, b ; 
input sub ; // 如 果 sub=1 做 减法 ， 否 则 做 加 法 
output [n-1:0] s ; 
output ovf ; // 车 溢出 则 为 1 
wire cl, c2 ; // 最 后 两 位 的 进位 输出 
assign ovf = cl ^ c2 ; // 如 果 符号 不 匹配 ,溢出 


// 非 符号 位 相 加 
assign {cl, s[n-2:0]} = a[n-2:0] + (b[n-2:0] ^ {n-1{sub}}) + sub ; 
// 符号 位 相 加 
assign {c2, s[n-1]) = a[n-1] + (b[n-1] ^ sub) + cl ; 
' endmodule 





图 10-14 具有 溢出 检测 的 加 /减法 单元 的 Verilog 行为 描述 。 其 实现 了 用 “+ ”运算 符 完成 2 
的 补 码 相 加 
一 且 我 们 有 了 一 个 减法 器 ， 然 后 在 输出 端 上 附加 一 个 零 检 查 器 ， 也 就 有 了 一 个 比较 器 。 如 果 
我 们 做 减法 ， 计 算 * =a -5， 然 后 如 果 s =0， 则 a=5， 并 且 如 果 s 的 符号 位 为 真 ， 则 (a -b) <0, 
所 以 a<b。 
当 不 同 长 度 的 带 符号 数 的 2 的 补 数 相 加 时 ， 首 先 必须 将 较 短 的 数 进行 符号 扩展 。 要 求 符 号 
位 (具有 负 权 重 ) 位 于 相同 的 位 置 。 如 果 不 进行 符号 扩展 就 将 数 相 加 ， 则 较 短 的 数 中 的 负 加 权 
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符号 位 将 错误 地 添加 到 较 长 数 的 正 加 权 位 上 。 例 如 ,我 们 将 - 6% 的 4 位 表示 方式 1010 加 到 
+8uo 的 6 位 表示 方式 001000 F, 我们 得 到 010010 =18,,。。 这 是 因为 1010 被 误解 为 101. 

通过 将 符号 位 复制 到 左边 的 新 位 置 ， 可 以 对 2 的 补 码 进行 符号 扩展 。 例 如 ， 将 1010 符号 
扩展 至 6 位 给 出 111010。 我 们 的 加 法 现在 变 成 111010 + 001000 = 000010 = 2,， 这 是 正确 的 
结果 。 

在 硬件 中 ， 完 成 符号 扩展 不 需 额外 的 门 电路 ， 只 需 将 符号 位 重复 连 线 。 在 Verilog 中 ， 可 
以 使 用 拼接 运算 符 轻 松 表达 。 例 如 ， 如 果 a 是 nn 位 长 且 b 是 m<n 位 长 , 我 们 要 将 b 的 符号 扩 
展 至 位 ， 需 编写 : 


parameter n Oo 2 


parameter m = 4 ; 


wire [n-1:0] a; 
wire [m-1:0] b ; 


. {{ (n-m+1) {b[m-1]}},b[m-2:0]} ... ; NN 将 b 符 号 扩展 到 n 位 


当 对 带 符号 数 的 2 的 补 数 移 位 时 ， 重 要 的 是 当 右 移 时 复制 符号 位 ， 当 左 移 时 检查 溢出 。 当 
结果 的 符号 与 输入 的 符号 不 同时 ， 左 移 会 发 生 溢出 。 要 正确 地 将 n 位 2 的 补 码 b 右 移 三 个 位 
É, 我们 需 编写 : 


{{3{bIn-1] }},b[n-1:3]} 


通过 变量 s 将 b 进行 移 位 , 0<s<m， 向 右 移 我 们 需 编 写 : 
{{m{b[n-1] }},b[n-1:0] }>>s 


例 10-3 负数 
将 数字 — 82 转换 为 符号 - 数值 码 、1 的 补 码 和 2 的 补 码 等 8 位 二 进 制 数 。 
我 们 注意 到 82 在 二 进 制 中 是 1010010,。 要 转换 为 符号 -数值 码 的 格式 ， 我 们 只 需 将 符号 
(1) 附加 到 该 数 的 开头 : 11010010, 1 的 补 码 形式 是 通过 反 相 正 数 (01010010) 的 所 有 位 得 到 
的 : 10101101。 最 后 ,我 们 通过 把 1 加 到 1 的 补 码 上 来 得 到 2 的 补 数 : 10101110, 
例 10-4 减法 
在 2 的 补 码 中 ， 从 721 减 去 8210。 
我 们 必须 先 将 72 和 -82 都 转换 为 二 进 制 : 01001000 和 10101110 ( 见 例 10-3), RE, & 
们 完成 加 法 : 
c 00010000 
01001000 
+ 10101110 
s 11110110 
最 后 ， 我 们 验证 11110110, 确实 等 于 -10,。 


10.4 乘法 
二 进 制 数 相 乘 与 十 进 制 数 相 乘 我 们 采用 同样 的 方式 : 通过 移 位 和 相 加 。 将 二 进 制 数 左 移 一 


位 相当 于 乘 以 2。 例 如 ，101, =5; 如 果 我 们 左 移 一 位 ， 我 们 得 到 了 1010, =10,,; 再 左 移 一 位 
得 到 10100, =20,,， 以 此 类 推 。 
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要 将 两 个 无 符号 二 进 制 数 4a, ,，…，ao AD, i, c, by AR, RI a 的 副本 移 位 并 加 到 
对 应 每 个 是 1 的 位 置 上 。 也 就 是 说 ， 我 们 计算 baa +b (a< <1) + +b, (a< <(n-1)). 
例如 ， 考虑 a =101, 乘 以 =110, (Su X69) 0 我 们 写成 竖 式 : 


此 时 bo =0， 因 此 该 0 的 行 在 不 移 位 位 置 。 因 为 b, =1, 我 们 将 101 移 1 位 ,以 及 因为 b, =2, 
将 101 移 2 位。 对 这 三 个 部 分 积 求 和 给 出 11110 =30,,. 

对 两 个 4 位 无 符号 二 进 制 数 执行 乘法 运算 的 电路 如 图 10-15 所 示 。16 个 与 门 的 阵列 形成 4 
个 4 位 部 分 积 。 第 一 行 4 个 与 门 形成 wa， 第 二 行 形成 bia 并 左 移 1 位 ， 以 此 类 推 。12 个 全 加 
器 的 阵列 然后 将 各 列 的 部 分 积 相 加 以 产生 8 位 的 乘积 户 ，…，Pos HH by Aa, 形成 部 分 积 中 的 
Ppm 位 ， 是 权重 (1) 的 唯一 的 部 分 积 ， 因 此 它 直 接 成 为 m。 部 分 积 中 的 ppo 和 pp 位 都 是 权重 
(2) ， 并 通过 全 加 器 相 加 得 到 巴 。 通 过 将 ppo. PPn 和 pp. SLB (1) 的 加 法 器 的 进位 输出 相 
加 来 计算 乘积 中 的 p, 位 。 以 类 似 的 方式 计算 其 余 的 位 ， 即 将 它们 所 在 列 的 部 分 积 与 来 自前 一 
列 的 进位 相 加 。 

请 注意 ， 在 某 列 中 的 所 有 部 分 积 都 具有 合计 为 该 列 权重 的 指数 ， 例 如 ，02、11 和 20 全 都 
合计 为 《2) 。 这 是 因为 由 输入 位 推导 出 的 部 分 积 的 权重 等 于 输入 位 的 指数 的 和 。 为 了 和 弄 明白 
这 一 点 ， 乘 法 可 以 考虑 表示 为 : 


p= Y F(a, Ab) x2” (10-12) 
4 位 乘法 器 的 Verilog 代码 如 图 10-16 所 示 。 4 个 赋值 语句 形成 部 分 积 pp0 到 pp3 ， 每 个 都 是 4 
位 向 量 。 然 后 三 个 4 位 加 法 器 被 实例 化 以 将 部 分 积 相 加 。 每 一 个 加 法 器 的 第 二 个 输入 级 联 自前 
一 个 加 法 器 的 高 三 位 输出 以 及 0 (对 于 第 一 加 法 器 ) 或 前 一 加 法 器 的 进位 输出 。 
图 10-15 和 图 10-16 的 乘法 器 实现 了 无 符号 数 相 乘 。u 输入 用 带 符号 数 的 2 的 补 码 ， 它 不 
会 产生 正确 结果 ， 因 为 部 分 积 在 相 加 之 前 并 没有 将 符号 扩展 到 全 位 宽 。 同 样 , 输入 用 负数 的 
2 的 补 码 ， 它 也 不 会 产生 正确 结果 。 这 是 因为 上 的 乘法 计算 用 8 加 权 而 不 是 -8。 我 们 将 能 
处 理 2 的 补 码 的 乘法 器 的 修改 留 做 习题 (习题 10.50) 。 此 外 ，Booth 重 编码 ( 见 12.2 3) 的 
使 用 会 产生 一 个 轻而易举 地 处 理 带 符号 数 的 乘法 器 。 
例 10-5 二进制 乘法 
LST KA ERA Deo 
该 乘法 运算 的 最 终结 果 为 B616。 我 们 展示 计算 过 程 如 下 : 
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// 4 位 乘法 器 

module Mul4(a,b,p) ; 
input [3:0] a,b ; 
output [7:0] p ; 


// 形成 部 分 积 

wire [3:0] ppo 4{b[0]}} ; 
4{b[1]}} ; 
4{b[2]}} ; 


4{b[3]}} ; 


wire [3:0] ppl 


II "I "I I 


wire [3:0] pp2 


{ 
{ 
{ 
{ 


wire [3:0] pp3 


// 计算 部 分 积 之 和 

wire coutl, cout2, cout3 ; 

wire [3:0] sl, s2, s3 ; 

Adderl #(4) al(pp1, {1'b0,pp0[3:1]}, 1’b0, coutl, 
Adderl #(4) a2(pp2, {couti,s1[3:1]}, 1’b0, cout2, 
Adderl #(4) a3(pp3, {cout2,s2[3:1]}, 1’b0, cout3, 


// PBR 
assign p = {cout3, s3, s2[0], s1[0], pp0[0]} ; 
endmodule 





图 10-16 4 位 无 符号 乘法 器 的 Verilog 代码 


10.5 除法 

此 时 ， 我 们 已 经 知道 了 如 何以 二 进 制 形式 表示 带 符号 整数 和 无 符号 整数 ， 以 及 如 何 对 这 些 
数 进行 加 法 、 减 法 和 乘法 。 要 完成 四 则 运算 需要 构建 一 个 简单 的 计算 器 ， 我 们 还 需要 学 习 如 何 
做 二 进 制 数 除法 。 

与 十 进 制 数 一 样 ， 我 们 通过 移 位 、 比 较 和 减法 来 除 二 进 制 数 。 给 定 一 个 位 的 除数 x 和 一 


个 e 位 的 被 除数 y， 我 们 得 到 * 位 的 商 9， 结 果 是 4 = | 二 | 。 我 们 还 可 以 计算 出 4 位 的 余数 *， 结 


果 是 r=y-qz=y( 模 x)。 为 了 正确 地 处 理 x=1l 的 情况 ， 商 输出 必须 与 被 除数 的 长 度 相同 。 

我 们 一 次 一 位 执行 除法 ， 从 左 (MSB) FAHER qo MERX x =27” x =x << (2b-1) 
Ars, =y 开 始 。 我 们 设 quai Staa Sraa BERIGA A MA ERR ry = raa 
= 25-1 ¥ 25-1» 并 右 移 1 位 除数 得 到 Xaa = =x%2-1 >l, 来 准备 下 一 次 迭代 。 在 每 个 i 位 ， 
我 们 重复 比较 ,计算 q =ar, RAWA ra r -qa R a ,=x! l, 

例如 ，132,, =10000100, 除 以 11,,。=1011,。 过 程 如 下 所 示 : 

1100 
1011110000100 y 
-1011000 x 





101100 r 
-101100 x; 
0 


对 于 前 4 次 迭代 ,i=7,，…, 4 (RER), x >y， 均 未 执行 减法 。 最 终 ， 在 第 5 次 迭代 
H, i=3, 我们 有 xs =1011000 <r; =y, MARNE q, = 1 并 做 减法 计算 出 r=y 一 x; =101100, 
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我 们 将 x, 右 移 得 到 x; =101100。 这 两 个 值 是 相等 的 ， 所 以 g, =1。 相 减 得 到 7; =0, IFA q 的 所 
有 后 面 的 位 均 为 0。 

一 个 6 位 除 以 3 位 的 除法 器 如 图 10-17 所 示 。 该 电路 由 几乎 相同 的 6 级 组 成 。 第 i 级 的 商 
的 第 q 位 是 通过 比较 经 过 恰当 移 位 后 的 输入 x' 和 来 自前 一 级 的 余数 r 来 产生 的 。 第 i 级 的 余 
数 ri_ 是 通过 一 个 减法 器 和 一 个 多 路 选择 器 来 产生 的 ,减法 器 从 前 一 级 的 余数 中 减 去 移 位 后 的 
输入 。 如 果 qg 为 真 ， 多 路 选择 器 选择 减法 的 结果 r! -xi 作为 新 的 余数 。 如 果 q. 为 假 ， 则 前 一 
级 的 余数 不 变 地 传递 下 去 。 第 0 级 产生 商 的 LSB q, 和 最 终 的 余数 r. 





图 10-17 二 进 制 除法 器 
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依据 门 电路 的 数量 ， 除 法 器 是 非常 昂贵 的 ， 但 并 不 像 图 10-17 所 示 的 那么 贵 。 为 了 清楚 起 
见 ， 该 图 展示 了 6 个 减法 器 和 6 个 比较 器 。 在 实际 中 ， 减 法 器 可 以 起 到 比较 器 的 作用 。 减 法 器 
的 进位 输出 可 以 用 作 商 的 位 。 如 果 减 法 器 的 进位 输出 为 1， 则 a > =b. 通过 这 种 优化 ， 可 以 使 
用 6 个 减法 器 和 6 个 多 路 选择 器 来 实现 该 电路 。 

可 以 通过 减少 减法 器 的 宽度 来 进行 进一步 的 优化 。 第 一 个 减法 器 可 以 做 成 单个 位 宽 。 要 弄 
明白 这 一 点 ， 注 意 到 % 左 移 5 位 后 ， 在 其 低 5 位 均 为 0。 因 此 ， 结 果 的 低 5 位 将 等 于 y 的 低 5 
位 yo， 我 们 就 不 需要 减 去 这 些 位 。 还 注意 到 如 果 x 除了 LSB 之 外 的 任何 位 为 1， 则 x% 左 移 5 位 
保证 大 于 y， 则 不 需要 减法 的 结果 。 因 此 ,我 们 不 需要 将 % 的 最 高 位 送 入 减法 器 。 然 而 ， 我 们 
需要 检查 x 的 最 高 位 是 否 为 1， 作 为 计算 商 的 MSB q; 的 一 部 分 。 如 果 x* 的 最 高 位 为 1!， 则 x 左 
移 5 位 大 于 y 且 g; =0。 通 过 这 些 观察 ， 我 们 看 到 第 一 个 减法 器 只 需要 从 y 的 MSB 中 减 去 x 的 
LSB, A, 1 位 减法 器 就 足够 了 。 通 过 类 似 的 一 组 参数 ， 对 于 计算 q, 的 级 我 们 可 以 使 用 2 位 
减法 器 ， 对 于 q 级 使 用 3 位 ， 对 于 9 级 使 用 4 位 减法 器 。9 和 go 级 也 可 以 使 用 4 位 减法 器 。 
qi 级 的 余数 保证 长 度 不 超过 5 位 ， 并 且 q 级 的 余数 最 多 为 4 位。 因此， 可 以 省 略 这 些 减法 器 的 
最 高 位 。 

6 位 除 以 3 位 的 除法 器 的 Verilog 代码 如 图 10-18 所 示 。 该 代码 使 用 减法 器 来 执行 比较 并 且 
优化 每 级 的 减法 器 的 宽度 。 每 个 减法 器 使 用 Adaer1 模块 (图 10-7) 实现 , 求 反 该 模块 的 第 
二 个 输入 并 且 进位 输入 设置 为 1 位 宽 (1 'pbl )。 每 个 多 路 选择 器 用 一 条 使 用 ?: 运算 符 的 赋值 
语句 来 实现 。 对 于 第 1 级 ， 检 查 输入 x 的 高 两 位 作为 比较 的 一 部 分 ， 然 后 在 第 2 级 中 检查 x 的 
MSB。 余 数 的 Verilog 代码 直接 来 自 原理 图 。 

除了 消耗 大 量 的 空间 外 ， 除 法 器 也 很 慢 。 这 是 因为 在 一 个 级 中 的 减法 必须 完成 才 可 以 确定 
多 路 选择 器 的 命令 ， 因 此 在 下 一 级 中 的 减法 之 前 的 中 间 余 数 才 可 以 启动 。 这 样 ， 穿 过 使 用 了 行 
波 进位 加 法 器 的 e 位 除 以 5 位 的 除法 器 的 延 时 与 c xb 成 正比 ， 因 为 必须 执行 长 度 为 b+1 位 
(在 第 一 个 6b 级 之 后 ) 的 进位 (c) 减法 。 这 与 乘法 器 中 的 部 分 乘积 可 以 并 行 求 和 是 相反 的 。 


// 6 位 除 以 3 位 除法 器 
在 每 一 级 ， 我 们 使 用 加 法 器 做 减法 和 比较 
加 法 器 从 1 位 宽 开 始 ， 增 长 到 4 位 宽 
作为 比较 的 一 部 分 ， 我 们 检查 加 法 器 左边 的 x 的 位 
从 第 4 次 迭代 ( 即 计 算 q [2] ) 开 始 ， 每 次 迭代 中 我 们 会 弃 余 数 的 一 位 。 其 保证 为 0 
module Divide(y, x, q, r) ; 
input [5:0] y ; // 被 除数 
input [2:0] x ; // 除数 
output [5:0] q ; // Ë 
output [2:0] r ; // 余数 


wire co5, co4, co3, co2, col, cod ; // 加 法 器 进位 输出 


wire sum5 ; // 加 法 器 的 和 输出 一 一 第 1 级 

Adderl #(1) subS(y[5],~x[0],1'b1, co5, sum5) ; 

assign q[5] = co5 & ~(|x[2:1]) ; // 如 果 x 左 移 5 位 后 大 于 y, 则 q [5] 为 0 
wire [5:0] r4 = q[5]? {sum5,y[4:0]} : y ; 


wire [1:0] sum4 ; // 加 法 器 的 和 输出 一 一 第 2 级 
Adderl #(2) sub4(r4[5:4], “x[1:0] ,1’bi, co4, sum4) ; 





10-18 6 位 除 以 3 位 的 除法 器 的 Verilog 代码 


#102 FRR eg 165 





assign q[4] = co4 & “x[2] ; // 比较 
wire [5:0] r3 = q[4]? {sum4,r4[3:0]} : r4 ; 


wire [2:0] sum3 ; // 加 法 器 的 和 输出 一 一 第 3 级 
Adderl #(3) sub3(r3[5:3],~x,1'b1, co3, sum3) ; 
assign q[3] = co3 ; // 比较 

wire [5:0] r2 = q[3]? {sum3,r3[2:0]} : r3 ; 


wire [3:0] sum2 ; // 加 法 器 的 和 输出 一 一 第 4 级 

Adderl #(4) sub2(r2[5:2],{1'’b1,~x},1’b1, co2, sum2) ; 

assign g[2] = co2 ; // 比较 

wire [4:0] rl = q[2]? {sum2[2:0],r2[1:0]} : r2[4:0] ; // msBH0, 舍弃 它 


wire [3:0] suml ; // 加 法 器 的 和 输出 一 一 第 5 级 

Adderl #(4) sub1(r1[4:1],{1’b1,~x},1'b1, col, sumi) ; 

assign q[1] = col ; // 比较 

wire [3:0] rO = q[1]? {sum1[2:0],r1[0]} : r1[3:0] ; // MSB 为 0， $F È 


wire [2:0] sum0 ; // 加 法 器 的 和 输出 一 一 第 6 级 
Adderl #(4) sub0(r0[3:0],{1’b1,~x},1’b1, co0, sum0) ; 
assign q[0] = co0 ; // 比较 
assign r = q[0]? sum0[2:0] : rO[2:0] ; // MSB 为 0， 合 弃 它 
endmodule 





图 10-18 (4) 


例 10-6 除法 
EA PVA 1246 0 

在 得 出 最 终 答 案 Di 之 前 ， 我们 的 计算 如 下 所 示 : 
00001101 
10010/11101010 
-10010000 
1011010 
-1001000 


10010 
=10010 
0 


小 结 


在 本 章 中 ,你 已 经 学 会 了 如 何 使 用 组 合 逻 辑 电 路 来 完成 算术 运算 。 我 们 已 经 看 到 了 如 何 表 
示 正 数 和 负数 以 及 如 何 完 成 基于 典型 计算 器 的 四 则 运算 : 整数 的 +、-、x 和 +*。 

我 们 使 用 加 权 表 示 法 表示 具有 多 位 数字 信号 的 数 ， 其 中 最 右边 一 位 (最 低 有 效 位 或 LSB) 
用 1 加权 ,并 且 所 有 其 他 位 具有 其 右边 相 邻 位 的 2 倍 的 权重 。 换 言 之 , 第 i 位 ， 如 果 它 为 1， 
则 表示 2 的 数值 。 

我 们 用 2 的 补 码 表示 负数 ， 其 中 最 左边 一 位 (最 高 有 效 位 或 MSB) 的 权重 是 无 效 的 。 在 带 
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符号 数字 中 ， 我 们 称 该 位 为 符号 位 。 符 号 位 为 0 的 数 为 正 数 ， 负 数 的 符号 位 为 1。 通过 求 反 每 
一 位 (1 的 补 码 ) 然后 加 1， 我 们 得 到 一 个 相反 数 。 当 我 们 对 带 符号 数 进行 运算 时 ， 我 们 必须 
经 常 对 它们 进行 符号 扩展 ， 多 次 复制 符号 位 ， 以 便 所 有 参与 运算 的 数 都 在 相同 的 位 置 上 有 其 符 
号 位 。 

利用 这 种 加 权 二 进 制 记 数 法 ， 我 们 可 以 一 次 一 位 地 执行 多 位 信号 的 加 法 ， 当 两 位 的 和 产生 
了 进 到 下 一 位 的 进位 输出 时 要 执行 进位 操作 。 通 过 写 出 用 于 将 相等 权重 的 三 个 位 相 加 得 到 一 个 
2 位 的 二 进 制 输出 的 真 值 表 ， 我 们 推导 出 了 全 加 器 。 多 位 加 法 是 通过 迭代 的 全 加 器 电路 完成 
的 。 为 了 执行 减法 ,我 们 采用 一 个 输入 的 2 的 补 码 〈 求 该 输入 的 相反 数 ) ， 然 后 相 加 。 

当 算术 运算 的 结果 太 大 而 不 能 在 输出 信号 的 宽度 上 表示 时 发 生 溢出 。 对 于 无 符号 加 法 ， 当 
有 最 后 一 位 的 进位 输出 时 检测 到 溢出 。 对 于 带 符号 的 加 法 ， 当 两 个 输入 同 号 并 且 输 出 具有 相反 
的 符号 时 ,或 者 当 进 到 符号 位 的 进位 与 符号 位 的 进位 输出 不 同时 ， 则 发 生 溢 出 。 有 一 些 系统 使 
用 饱和 算法 来 限制 由 溢出 引起 的 误差 。 

执行 乘法 和 除法 与 十 进 制 数 完全 一 样 。 通 过 乘法 ， 一 个 输入 的 每 一 位 与 另 一 个 输入 的 每 一 
位 相 乘 ( 相 与 ) ， 形 成 一 个 部 分 积 的 矩阵 。 每 个 部 分 积 具 有 的 权重 由 推导 出 该 部 分 积 的 输入 的 
权重 的 乘积 给 出 。 也 就 是 说 ，pp; =a, Ab, 具有 权重 2 “。 加 法 器 数组 用 于 求 和 部 分 积 以 给 出 最 
终 的 答案 。 我 们 将 在 第 12 章 中 看 到 如 何 更 快 地 做 到 这 一 点 。 

除法 器 通过 从 当前 余数 (第 一 次 迭代 的 被 除数 ) 中 减 去 移 位 后 的 除数 来 执行 二 进 制 长 除法 。 


习题 

10.1 十 进 制 到 二 进 制 转换 ， 工 。 将 817 从 十 进 制 转换 到 二 进 制 记 数 法 ， 使 用 尽 可 能 少 的 位 数 ， 用 十 六 
进 制 表达 结果 。 

10.2 TERES REH, Mo H 1492 从 十 进 制 转换 到 二 进 制 记 数 法 ， 使 用 尽 可 能 少 的 位 数 ， 用 十 六 
进 制 表达 结果 。 

10.3 ”十进制 到 二 进 制 转换 ， 焉 。 将 1963 从 十 进 制 转换 到 二 进 制 记 数 法 ， 使 用 尽 可 能 少 的 位 数 ， 并 用 十 
六 进 制 表达 结果 。 

10.4 十 进 制 到 二 进 制 转换 ，IV 。 将 2012 从 十 进 制 转换 到 二 进 制 记 数 法 ， 使 用 尽 可 能 少 的 位 数 ， 并 用 十 
六 进 制 表 达 结 

10.5 二 进 制 到 十 进 制 转换 ， 工 。 将 0011 0011 0001 从 二 进 制 转换 到 十 进 制 记 数 法 。 

10.6 -aata a, Mo K Oon 1111 从 二 进 制 转换 到 十 进 制 记 数 法 。 

10.7 二进制 到 十 进 制 转换 ， 亚 。 将 0100 1100 1011 0010 1111 从 二 进 制 转换 到 十 进 制 记 数 法 。 

10.8 ”二进制 到 十 进 制 转换 ，IV 。 将 0001 0110 1101 从 二 进 制 转换 到 十 进 制 记 数 法 。 

10.9 十 六 进 制 到 十 进 制 转换 ， 工 。 将 2C 从 十 六 进 制 转换 到 十 进 制 记 数 法 ， 并 用 二 进 制 编码 的 十 进 制 
(BCD) 记 数 法 表达 该 数 。 

10.10 十 六 进 制 到 十 进 制 转换 ， 卫 。 将 数 BEEF 从 十 六 进 制 转换 到 十 进 制 记 数 法 ， 并 用 二 进 制 编码 的 十 
进 制 (BCD) 记 数 法 表达 该 数 。 

10.11 十 六 进 制 到 十 进 制 转换 ， 亚 。 将 2015 从 无 符号 的 十 六 进 制 转换 到 十 进 制 记 数 法 ， 并 用 二 进 制 编 
码 的 十 进 制 (BCD) 记 数 法 表达 该 数 。 

10.12 ”十 六 进 制 到 十 进 制 转换 ，IV 。 将 FOOD 从 无 符号 的 十 六 进 制 转换 到 十 进 制 记 数 法 ， 并 用 二 进 制 编 
码 的 十 进 制 (BCD) 记 数 法 表达 该 数 。 

10.13 十 六 进 制 到 十 进 制 转换 ，V 。 将 DEED 从 无 符号 的 十 六 进 制 转换 到 十 进 制 记 数 法 ， 并 用 二 进 制 编 
码 的 十 进 制 (BCD) 记 数 法 表达 该 数 。 

10.14 三 进 制 加 法 ， 工 。 下 列 一 对 二 进 制 数 相 加 

1010 

+0111 
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10. 15 


10. 16 


10. 17 


10. 18 


10. 19 
10. 20 


10. 21 


10. 22 


10, 23 


10. 24 
10. 25 
10. 26 
10. 27 
10. 28 
10. 29 


10. 30 


10. 31 





二 进 制 加 法 ， 开 。 下 列 一 对 二 进 制 数 相 加 
011 1010 

+110 1011 

三 进 制 加 法 ， 亚 。 下 列 一 对 十 六 进 制 数 相 加 : 
2A 

+3C 

二 进 制 加 法 ，IV 。 下 列 一 对 十 六 进 制 数 相 加 : 
BC 

+AD 





位 计数 电路 ， 设计。 使 用 全 加 器 设计 一 个 可 以 接受 7 位 输入 的 电路 ， 并 用 3 位 二 进 制 数 输出 输入 
中 1 的 个 数 。 

位 计数 电路 ， 实 现 。 编 写 -Verilog 代码 实现 习题 10. 18 中 的 电路 并 通过 仿真 证 明 其 能 正确 运行 。 
饱和 加 法 器 ， 设 计 。 在 某 些 应 用 中 ,特别 是 在 信和 号 处 理 方面 ， 期 望 具有 加 法 器 饱和 ， 在 溢出 情 
况 下 产生 2" -1 的 结果 ， 而 不 是 产生 模 数 的 结果 。 设 计 一 个 饱和 加 法 器 。 你 可 以 使 用 mm 
位 加 法 器 和 并 位 多 路 选择 器 作为 基本 器 件 。 

饱和 加 法 器 ， 实 现 。 为 习题 10. 20 的 饱和 加 法 器 编写 Verilog 代码 ， 并 用 典型 的 测试 用 例 仿真 它 来 
证 明 其 能 正确 操作 。 你 的 代码 应 该 以 加 法 器 的 宽度 作为 参数 。 

矢量 加 法 器 。 设计 一 个 既 可 以 起 到 一 个 32 位 加 法 器 ， 又 可 以 起 到 两 个 16 位 加 法 器 或 者 起 到 4 个 
8 位 加 法 器 作用 的 电路 ， 并 编写 Verilog 代码 。 在 你 的 电路 中 最 多 可 以 有 32 个 全 加 器 。 模 块 的 输 
AX a[31:0], b[31:0], add2 x16, add4 x8， 且 输出 为 s[31:0]。 相 关 操 作 参 考 表 10-4， 
你 不 需要 处 理 减法 或 溢出 。 


表 10-4 习题 10. 22 的 矢量 加 法 器 的 输出 规格 








add2x16 add4x8 # R 
0 0 s[31:0] =a[31:0] +b[31:0] 
1 0 s[31:16] =a[31;16] +b[31;16]s[15;0] =a[ 15:0] +b[15;0] 
0 l s[31:24] =a[31:24] +b[31;24]...s[7:0] =a[7:0] +b[7:0] 
1 1 s[31:0] =32’ hx 


你 不 能 将 表 10-4 简单 地 实现 为 case 或 casex 语句 。 
BCD 加 法 ， 设 计 。 设 计 一 个 接受 两 个 3 位 (12 位 二 进 制 ) BCD 码 (公式 (10-6)) 的 电路 ， 并 
用 BCD 码 输 出 它们 的 和 。 
BCD 加 法 ， 实 现 。 用 Verilog 编写 习题 10. 23 中 的 BCD 加 法 器 ， 并 使 用 测试 平台 验证 其 操作 。 
负数 ， 工 。 将 +17 表示 为 8 位 二 进 制 符号 -数值 码 ，1 的 补 码 和 2 的 补 码 。 
ñ jk, H. H -17 表示 为 8 位 二 进 制 符号 -数值 码 ，1 的 补 码 和 2 的 补 码 。 
负数 ， 亚 。 将 -31 表示 为 8 位 二 进 制 符号 -数值 码 ，1 的 补 码 和 2 的 补 码 。 
负数 ，IV 。 将 -32 表示 为 8 位 二 进 制 符号 -数值 码 ，1 的 补 码 和 2 的 补 码 。 
减法 ， 工 。 下 列 一 对 二 进 制 2 的 补 码 相 减 : 
0101 
-0110 
减法 ， 工 。 下 列 一 对 二 进 制 2 的 补 码 相 减 : 
0101 
-1110 
减法 ， 亚 。 下 列 一 对 二 进 制 2 的 补 码 相 减 : 
1010 
-0010 











168 


RAD HFK EB 





10. 32 


10. 33 


10. 34 


10. 35 


10. 38 


10. 39 


10. 40 


10. 41 


10. 42 


10. 43 


10. 44 


10. 45 


10. 46 


10. 47 





减法 ， 玉 。 下 列 一 对 二 进 制 2 的 补 码 相 减 : 

0101 

-0111 
1 的 补 码 加 法 器 ， 设 计 。 设 计 一 个 1 的 补 码 加 法 器 。 GER: 首先 将 两 个 数 正常 相 加 ， 如 果 第 一 
次 相 加 有 进位 ， 你 需要 增加 结果 以 便 给 出 正确 的 答案 。 虽 然 简 单 的 解决 方案 需要 一 个 加 法 器 和 一 
个 增 量 器 ， 但 也 可 以 使 用 单个 加 法 器 来 完成 ) 。 
1 的 补 码 加 法 器 ， 实 现 。 为 你 的 1 的 补 码 加 法 器 (习题 10.33) 编写 Verilog 代码 ， 并 用 典型 的 测 
试用 例 仿真 它 来 证 明 其 能 正确 操作 。 
饱和 的 2 的 补 码 加 法 器 ， 设 计 。 在 习题 10.20 中 ,我 们 看 到 了 如 何 为 正 数 构建 一 个 饱和 加 法 器 。 
在 本 题 中 ， 你 来 扩展 此 设计 使 得 它 能 处 理 负数 ， 即 在 正方 向 和 负 方 向 上 均 饱 和 。 在 正方 向 上 溢出 
时 ， 加 法 器 将 产生 2" 一 -1， 而 在 负 方 向 上 的 溢出 时 ， 它 应 该 产生 -2 一。 
饱和 的 2 的 补 码 加 法 器 ， 实 现 。 为 你 的 饱和 的 2 的 补 码 加 法 器 〈 习 题 10.35) 编写 Verilog 代码 ， 
并 用 典型 的 测试 用 例 仿 真 它 来 证 明 其 能 正确 操作 。 
符号 -数值 码 加 法 器 ， 设 计 。 设 计 一 个 接受 两 个 二 进 制 符号 - 数值 码 的 电路 ， 并 以 符号 -数值 码 
的 格式 输出 它们 的 和 。 
符号 -数值 码 加 法 器 ， 实 现 。 为 习题 10. 37 的 符号 - 数值 码 加 法 器 编写 Verilog 代码 ， 并 用 典型 的 
测试 用 例 仿 真 它 来 证 明 其 能 正确 操作 。 

非 标准 的 带 符号 表示 法 。 考 虑 一 个 4 位 表示 法 ， 其 可 以 表示 从 -4 到 11 的 数 。 每 个 负数 用 其 标准 
的 2 的 补 码 表示 法 来 表示 ， 例 如 ，-4 =1100。 同 样 ， 每 个 正 数 用 其 标准 的 二 进 制 表示 法 来 表示 ， 
例如 ，11 =1011 。 

(a) 为 这 个 表示 法 绘制 数字 轮 盘 (JILE 10-9), 

(b) 绘制 一 个 加 法 器 ， 对 这 些 数 进行 运算 并 检测 溢出 。 

(c) 解释 如 何 对 这 些 数 之 一 求 反 。 

乘法 ， 工 。 下 列 一 对 无 符号 二 进 制 数 相 乘 ， 

0101 

x0101 

乘法 ， 工 。 下 列 一 对 无 符号 二 进 制 数 相 乘 : 

0110 

x0011 
乘法 ， 焉 。 下 列 一 对 无 符号 二 进 制 数 相 乘 : 

1001 

x 1001 

Rik, N. FIX S + AE HBO : 

A 

x: G 


5 倍 电路 。 使 用 加 法 器 、 组 合 电路 基础 单元 和 门 电路 设计 一 个 电路 ， 该 电路 接受 一 个 4 位 二 进 制 
2 的 补 码 输入 a[3 :0] ， 输 出 一 个 7 位 2 的 补 码 输出 b[ 6 :0 ] ， 输 出 是 输入 值 的 5 倍 。 你 不 可 以 使 
用 乘法 基础 单元 。 使 用 可 能 的 最 少 加 法 器 的 位 数 。 

15 倍 电路 。 使 用 加 法 器 、 组 合 电路 基础 单元 和 门 电路 设计 一 个 电路 ， 该 电路 接受 一 个 4 位 二 进 制 
2 的 补 码 输入 a[3 :0] ， 输 出 一 个 8 位 2 的 补 码 输 出 b[7 :0] ， 输 出 是 输入 值 的 15 倍 。 你 不 可 以 
使 用 乘法 基础 单元 。 使 用 可 能 的 最 少 加 法 器 的 位 数 。 

16 倍 电路 。 设 计 一 个 电路 ， 其 接受 8 位 二 进 制 2 的 补 码 输 入 aL7 :0] ， 并 输出 一 个 12 位 2 的 补 码 
输出 b[11:0] ， 输 出 是 输入 值 的 16 倍 。 使 用 尽 可 能 少 的 逻辑 器 件 。 

BCD 乘法 ， 设 计 。 设 计 一 个 电路 ， 其 接受 两 个 3 位 数 的 BCD 码 (12 位 二 进 制 ) ( 见 公式 (10-6) ) 
并 以 BCD 码 格式 输出 它们 的 乘积 。 
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10. 48 
10. 49 


10. 50 


10. 51 


10. 52 
10. 53 
10. 54 
10. 55 
10. 56 


BCD 乘法 ， 实 现 。 用 Verilog 编写 习题 10.47 中 的 设计 ， 并 使 用 测试 平台 验证 其 操作 。 

电路 设计 。 使 用 加 法 器 、 组 合 电路 基础 单元 和 门 电路 ,设计 一 个 接受 4 个 输入 a、b、c #l d 并 输 

出 表达 式 a -b+ (cxd) 的 电路 。 输入 a 是 一 个 4 位 2 的 补 码 ， 输 入 b 是 一 个 4 位 1 的 补 码 。 输 

入 c 是 一 个 2 位 无 符号 数 。 输 入 d 是 一 个 4 位 无 符号 数 。 

2 HARES, 设计。 设计 一 个 二 进 制 2 的 补 码 乘 法 器 ， 考 虑 两 种 方法 : 

(a) 符号 扩展 部 分 积 用 来 处 理 输入 a 是 负数 ， 并 且 如 果 》 是 负数 ， 则 添加 一 个 “ 补 码 器 ”用 来 求 
最 后 一 组 部 分 积 的 相反 数 。 

(b) 将 两 个 输入 转换 为 符号 -数值 记 数 法 ， 无 符号 数 相 乘 ， 然 后 将 结果 转换 回 2 的 补 码 。 

比较 两 种 方法 的 成 本 和 性 能 (延迟 ) 。 选 择 付 出 最 低 成 本 的 方法 ， 并 以 基本 器 件 〈 门 电路 ， 加 法 

器 等 ) 展示 该 设计 。 

2 的 补 码 乘法 器 ， 实 现 。 为 习题 10. 50 的 2 的 补 码 乘法 器 编写 Verilog 代码 ， 并 用 典型 的 测试 用 例 

仿真 它 来 证 明 其 能 正确 操作 。 

二 进 制 除法 ， 工 。 下 列 一 对 无 符号 二 进 制 数 相 除 〈 展 示 计 算 过 程 的 每 个 步骤 ) : 101110, +101,, 

三 进 制 除法 ， 开 。 下 列 一 对 无 符号 二 进 制 数 相 除 (展示 计算 过 程 的 每 个 步 又) : 101110, =011,。 

三 进 制 除法 ， 亚 。 下 列 一 对 无 符号 十 六 进 制 数 相 除 (展示 计算 过 程 的 每 个 步骤 ) : AE. + Eso 

二 进 制 除法 ，V。 下 列 一 对 无 符号 十 六 进 制 数 相 除 (展示 计算 过 程 的 每 个 步 又 ) : F716 +6460 

除法 器 中 的 减法 器 宽度 。 针 对 下 列 每 一 对 参数 的 宽度 ， 确 定 在 除法 器 的 每 一 级 中 所 需 的 减法 器 的 

宽度 : 

(a) 被 除数 4 位 ， 除 数 4 位; 

(b) 被 除数 6 位， 除数 4 位; 

(e) 被 除数 4 位 ， 除 数 3 位 。 
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第 11 章 | 


Digital Design: A Systems Approach 


定点 数 和 浮 点 数 





在 第 10 章 中 ,我 们 介绍 了 计算 机 的 算术 运算 基础 :二进制 整数 的 加 法 、 减 法 、 乘 法 和 除 
法 。 在 本 章 中 ， 我 们 着 眼 于 数 的 表示 方法 来 更 为 详细 地 继续 探讨 计算 机 的 算术 运算 。 常 常 整数 
不 足以 满足 我 们 的 需要 。 例 如 ,假设 我 们 希望 表示 从 0 (真空 ) 到 0. 9 个 大 气压 之 间 变 化 的 压 
H, 误差 最 多 为 0. 001 个 大 气压 。 整 数 不 会 有 助 于 我 们 区 分 0. 899 和 0.9。 对 于 这 项 工作 ,我 
们 将 引入 二 进 制 小 数 点 (类似 于 十 进 制 小 数 点 ) 的 概念 ， 并 使 用 二 进 制定 点 数 。 

在 某 些 情况 下 ， 我 们 需要 用 非常 大 的 动态 范围 来 表示 数据 。 例 如 ,假设 我 们 需要 表示 从 
1 ps (10° s) 到 一 个 世纪 (大约 3 x10”s) 的 时 间 间 隔 范围 ， 准 度 (accuracy) 为 1%。 要 
用 定点 数 来 横 跨 这 个 时 间 范 围 需要 72 位。 但是， 如 果 使 用 浮 点 数 (其 允许 我 们 改变 二 进 制 
小 数 点 的 位 置 ) 我 们 就 可 以 用 13 位 表示 : 6 位 表示 这 个 数 以 及 7 位 编码 二 进 制 小 数 点 的 
位 置 。 


11.1 误差 的 表示 方法 : 准 度 、 精 度 和 分 辨 率 

伴随 着 数字 电子 技术 ， 我 们 将 一 个 数 * 表示 为 一 串 二 进 制 数 5。 在 数字 系统 中 使 用 了 很 多 
不 同 的 数 制 系统 ， 一 种 数 制 系统 可 以 被 看 作 R 和 VV 两 个 函数 。 表 示 函 数 (representation func- 
tion) R 将 来 自 某 个 数 集 ( 例 如 实数 集 、 整 数 集 等 ) 的 一 个 数 x 映射 成 一 个 位 串 b:b = R(x). 
取 值 函 数 (value function) 了 返回 由 一 个 特定 的 位 串 表 示 的 这 个 数 (来 自 同 一 数 集 ) : y=V(b). 

考虑 映射 到 和 映射 自 某 个 范围 内 的 实数 集 。 由 于 具有 的 实数 可 能 比 具 有 的 给 定 长 度 的 位 串 更 
多 ， 因 此 很 多 实数 必然 会 映射 到 同一 个 位 串 上 。 因 此 ， 如 果 用 将 一 个 实数 映射 到 一 个 位 串 上 ， 
然后 用 VV 返回， 通常 会 得 到 一 个 与 开始 时 稍 有 不 同 的 实数 。 也 就 是 说 ， 如 果 计 算 y=V(R(x))， 
则 y 和 x 将 不 同 。 这 个 差异 就 是 表示 方法 的 误差 。 我 们 既 可 以 在 绝对 意义 上 (例如 ， 表 示 具 有 
2 mm 的 误差 ) 又 可 以 相对 于 这 个 数 的 大 小 (例如 ,表示 有 具有 3% 的 误差 ) 来 表示 误差 。 在 点 x 
处 表示 的 绝对 误差 如 下 所 示 : 
e, = |V(R(x)) -x| (11-1) 
而 且 相 对 误差 为 š 

ee [nren = 
x 

一 种 数 的 表示 方法 的 优 劣 程度 是 由 它 的 准 度 (accuracy) 或 精度 (precision) 给 出 的 ,2 BB 

在 其 输入 范围 X 内 的 最 大 误差 。 绝 对 准 度 由 下 式 给 出 : 





(11-2) 


a, = max|V(R(x)) - | (11-3) 
且 相 对 准 度 为 ;: 
4, = mak | OR = x (11-4) 








理所当然 ， 在 *=0 附近 不 定义 相对 准 度 。 当 我 们 想 以 给 定 的 相对 准 度 节 俭 地 表示 数 时 ， 常 常 
使 用 浮 点 数 。 当 我 们 想 以 给 定 的 绝对 准 度 节俭 地 表示 数 时 ， 定 点 数 效率 更 高 ， 我 们 将 在 下 面 的 





日 ”在 本 书 中 我 们 互 换 地 使 用 术语 准 度 和 精度 。 
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节 中 描述 这 两 种 表示 方法 。 | 

有 时 人 们 指 的 是 在 数 制 系统 中 使 用 的 位 数 ， 即 其 长 度 (对 于 长 度 ， 经常 误 用 作 术 语 精 度 ; 
例如 ,说 一 个 系统 具有 32 位 的 精度 ) 。 在 其 他 时 候 ， 人 们 指 的 是 通过 数 制 系统 可 以 分 辨 的 最 小 
差别 ， 即 系统 的 分 辩 率 。 在 测定 表示 方法 的 优 劣 程度 时 ， 用 到 的 既 不 是 长 度 也 不 是 分 辨 率 ， 而 
是 准 度 。 

例如 ,假设 我 们 通过 用 最 接近 的 整数 表示 每 个 实数 , OE X= [0, 1000] 范围 内 的 实数 表 
示 为 10 位 二 进 制 整数 。 为 一 个 实数 挑选 一 个 最 接近 的 整数 通常 指 的 是 将 该 实数 合 入 为 一 个 整 
数 。 将 512. 742 表示 为 513 或 1000000001,， 并 且 表 示 这 个 数 的 误差 为 e,(512.742) = 
|512.742 -513 | =0. 258 。 因 为 一 个 值 介 于 两 个 整数 之 间 (例如 512.500)， 因 此 在 整个 范围 内 
的 误差 是 a,(X) =0.5， 无 论 是 向 上 舍 入 还 是 向 下 侈 去 都 会 有 这 么 大 的 误差 。 注 意 到 ， 在 这 里 
的 误差 取决 于 表示 函数 尺 。 如 果 我 们 选择 R 以 便 可 以 通过 使 用 小 于 % 的 、 最 接近 的 整数 来 表示 
每 一 个 数 x， 则 得 到 e,(512.742) =0.742 和 a,(X) =1。 对 于 正 实数 ， 采 用 第 二 个 表示 函数 通 
常 指 的 是 将 实数 截断 为 一 个 整数 。 

同样 ， 不 应 该 将 准 度 与 分 辨 率 混 消 。 上 面 讨论 的 舍 人 表示 法 和 截断 表示 法 的 分 辨 率 均 是 
1.0， 即 整数 间隔 的 一 个 单位 。 但 是 ， 舍 入 的 准 度 为 0. 5， 而 截断 的 准 度 则 为 1. 0。 
例 11-1 计算 准 度 

在 1.3 节 中 ,我 们 将 68 和 82 之 间 的 温度 表示 为 3 位 二 进 制 数 ， 其 中 : 


T = 68 + 2 Y” 2'TempA, 
i=0 


对 于 这 种 表示 方法 ， 给 出 该 表示 法 的 绝对 准 度 、 相 对 准 度 和 分 状 率 。 只 计算 68 Fo 82 之 间 的 
值 ， 并 采用 舍 入 。 
在 该 表示 法 中 分 辩 率 或 LSB 的 权重 为 2。 绝 对 准 度 a, 为 1。 例 如， 数值 79 向 上 使 入 为 80 
且 |79 -80|=1。 介 于 68 和 70 之 间 的 数 ， 特 指 69， 则 有 最 小 相对 准 度 : 
na kx 2 
š 69 
z k 52] 
69 
a, = 1.4% 
对 于 68 Fo 82 之 间 的 数 ， 这 种 表示 法 具有 1.4% 的 准 度 。 
例 11-2 表示 方法 设计 
分 辨 率 为 多 大 能 够 表示 从 54 500 000 km 到 4 500 000 000 km 的 数 且 准 度 为 3%? 这 是 分 别 
表示 太阳 和 水 星 ， 以 及 太阳 和 海王 星之 间距 离 的 范围 。 采 取舍 入 表示 法 。 
最 大 误差 将 介 于 54 500 000 和 54 500 000 +r 的 中 间 ， 其 中 rr 表示 分 辨 率 。 所 以 
V(R(x)) -x 
x 


54 500 000 - 54 500 000 - 0. 5r 
54 500 000 + 0. 5r 


r= 3 370 000 
为 了 实现 目标 ，LSB 在 表示 方法 中 需要 表示 3 370 000 km 或 更 小 。 用 来 计算 所 表示 的 距离 D 
(D RA 11 位 表示 法 且 LSB 的 权重 为 3 000 000 km) 的 取 值 函数 是 : 








a,= | 





3% = | 


10 
D = 54.5 x 10° +3 x 10°} 2° 
i=0 
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11.2 定点 数 


11.2.1 表示 方法 
一 个 5 位 的 二 进 制定 点 数 是 一 种 表示 方法 ,该 数 a,_; ，a,，，*…，a,，ao 的 值 由 下 式 给 出 : 


n-1 
p = 2) an” (11-5) 


其 中 , 是 一 个 常数 ， 以 位 为 单位 ， 从 该 数 左 端 开 始 ， 给 出 了 二 进 制 数 小 数 点 的 位 置 。 

例如 ,考虑 一 种 具有 n=4 位 数 的 定点 数 制 系统 ， 在 p=1 时 二 进 制 小 数 点 在 最 高 有 效 位 的 
右边 。 也 就 是 说 ， 在 二 进 制 小 数 点 的 右边 有 3 位 〈 即 该 数 的 小 数 部 分 ) 以 及 在 二 进 制 小 数 点 的 
左边 有 1 位 ( 即 该 数 的 整数 部 分 )。 通 常 采用 简写 的 p.f 来 指 一 个 数 的 整数 位 和 小 数位 。 使 用 
这 种 n=4 和 p=1 简写 的 数 制 系统 是 一 个 1.3 定点 数 制 系统 。 如 果 在 整数 位 的 左边 添加 一 个 附 
加 的 符号 位 ， 把 所 得 到 的 p+f+1 位 数 制 系统 称 作 sp.f 数 制 系统 。 在 sp.f 数 制 系统 中 使 用 2 的 
补 码 。 

小 数 的 位 数 /=n - p 决定 了 数 制 系统 的 分 状 率 。 分 辨 率 或 可 以 分 状 的 最 小 间隔 是 r=27。 
例如 ， 对 于 f=3，1.3 定点 数 制 系统 的 分 辨 率 为 1/8 或 0.125， 二进制 数 的 每 一 个 增 量 改 变 的 
数值 表示 为 /8。 整 数 的 位 数 p 决定 了 数 制 系 统 的 范围 。 采 用 这 种 数 制 系统 ， 可 以 表示 的 最 大 
BOE 2? - r。 对 于 带 符号 的 数 制 系统 ， 可 以 表示 的 最 小 数 (最 大 的 相反 数 ， 不 是 最 接近 零 ) 是 
-2"。 为 了 有 时 能 更 容易 看 出 范围 和 精度 ， 重 写 公 式 (11-5) 如 下 : 


n-l 
s = r X` a2 (11-6) 


要 将 二 进 制 定点 数 转换 为 十 进 制 ， 只 需 转换 为 整数 并 乘 以 上 。 表 11-1 给 出 了 一 些 定点 数 示 
例 及 其 转换 为 十 进 制 和 分 数 的 表示 。 


表 11-1 定点 数 示例 





# = # = r # 数 # f 
1.3 1.011 0.125 11 1.375 (11/8) 
81.3 01.011 0. 125 11 1.375 (11/8) 
sl. 3 11.011 0. 125 -5 0.625 ( -5/8) 
2.4 10.0111 0. 0625 39 2.4375 (39/16) 


要 将 十 进 制 数 转 换 为 二 进 制定 点 数 ， 最 简单 的 方法 是 (a) 将 十 进 制 数 乘 以 2 ，(b) 将 得 
到 乘积 伟人 为 最 接近 的 整数 ，(e) 将 得 到 的 十 进 制 整数 转换 为 二 进 制 整数 。 例 如 ， 假 设 要 将 
1. 389 转换 到 1. 3 定点 格式 。 先 乘 以 8 ， 得 到 11.112, AERAR 11 ， 再 转换 为 二 进 制 ， 得 到 
1.011， 即 表示 1.375。 因 此 ， 在 这 种 表示 方法 中 的 误差 (表示 值 和 实际 值 之 间 的 差 值 ) 为 
1.389 -1.375 =0. 014, 或 刚好 超过 实际 值 的 1% 。 如 果 总 是 舍 人 到 最 接近 的 值 ， 在 该 范围 内 的 
所 有 值 (表示 的 准 度 ) 的 最 大 误差 应 该 是 2 ， 在 上 述 情况 下 是 0.0625。 当 取 值 越 接 近 0， 这 
个 用 数值 百分比 表示 的 误差 越 大 。 对 于 接近 0 的 数 ， 误 差 为 100% 。 

尽管 十 进 制 整数 可 以 零 误差 地 转换 为 二 进 制 整数 ， 但 通常 不 能 将 十 进 制 小 数 无 误差 地 转换 
为 有 限 长 的 二 进 制 小 数 。 这 是 因为 5 不 能 被 任何 2 AS FREER, 0. 1 不 能 被 精确 地 表示 为 有 限 长 
度 的 二 进 制 小 数 。 表 示 2 HOE (eu 0.25. 0.125 等 ) 的 十 进 制 小 数 可 以 精确 地 表示 为 二 进 制 
小 数 。 但 却 不 能 精确 地 表示 其 他 的 十 进 制 小 数 ， 例 如 0.1 或 0.389。 当 增加 更 多 的 数位 时 ， 误 
差 会 变 得 更 小 ,但 它 永 远 不 会 为 零 。 如 果 需 要 零 误 差 ， 则 可 以 按 比例 缩放 该 数 (例如 ， 乘 以 
1000) ,或 者 可 以 用 BCD 码 表示 。 





二 进 制 定点 数 经 常用 在 信号 处 理 方面 的 应 用 ,例如 ， 用 于 人 处理 音频 流 和 视频 流 。 在 这 些 
Sih, BAIPRORSOROER-A SUNDA, GRE RNC Shoop DLE RO 
范围 ， 同 时 消除 (或 最 小 化 ) 溢出 的 可 能 性 。 通 常 ， 按 比例 缩放 所 表示 的 数值 使 其 落 在 -1 和 
1 区 间 内 ， 因 此 它们 可 以 用 0. f 格式 来 表示 。 对 于 大 多 数 信号 处 理 ，16 位 就 足够 了 ， 并且 使 用 
s0. 15 格式 。 

考虑 一 个 示例 : 用 10 mV 的 精度 来 表示 一 个 0V 和 10 V 之 间 的 电压 。 假 设 希 望 这 种 表示 法 使 
用 最 少 的 位 数 。 很 明显 ， 在 二 进 制 小 数 点 的 左边 需要 4 位 来 表示 10。 为 了 达到 10 mV 的 精度 ， 将 
需要 20 mV 的 分 辩 率 。 因 此 ， 在 二 进 制 小 数 点 右边 需要 6 位 ， 即 得 到 一 个 2“ =0.015 625 的 分 
辩 率 和 2”=0.007 812 5 的 精度 。 因 此 ， 使 用 10 位 的 4. 6 定点 数 格式 可 以 直接 将 该 电压 范围 表 
示 到 指定 的 精度 。 

男 一 种 表示 法 使 用 一 个 按 比 例 缩放 的 数 。 如 果 使 用 一 个 9 位 二 进 制 数 ， 可 以 表示 0 ~511 
的 值 。 如 果 按 20 mV 的 比例 来 缩放 这 个 数 ， 即 一 个 二 进 制 的 1 对 应 于 20 mV ,那么 就 可 以 只 用 
9 位 来 表示 具有 10 mV 精度 的 10 V 量程 。 


例 11-3 转换 二 进 制定 点 数 

将 4.23 转换 为 下 列 每 一 种 定点 数 格式 ， 然 后 再 转换 回 十 进 制 。 全 部 采取 舍 入 。 

1) s4.2; 

2) 4.5; 

3) 12 位 ， 其 中 将 表示 的 数 x100。 

该 数 的 整数 部 分 到 十 进 制 的 转换 是 件 容 易 的 事 : 4o =100,。 采 用 类 似 于 如 何 转换 整数 的 方 
法 得 到 了 该 数 的 小 数 部 分 





0. 23,5 0. 000, 

- 0.125, + 0. 001, 
0. 105, 0. 0010, 

~ 0. 0625, + 0. 0001, 
0. 0425, 0. 00110, 


- 0. 03125, + 0. 00001, 
0.01125, 0. 0011100, 

— 0. 0078125, + 0. 0000001, 
0. DTT 0. 0011101, 





注意 ， 不 能 在 有 限 的 二 reerrer rrr ere Te 为 了 将 此 值 表示 为 一 个 
84.2 的 数 ， 将 该 数 的 小 数 部 分 合 入 为 0.01,， 得 到 答案 00100. 01。 将 这 个 数 转 换 回 十 进 制 得 
到 4.251,。 按 4.5 格式 ， 该 数 的 答案 是 00100.00111, 或 4.21875,,。 最 后 ， 按 比例 缩放 4.23 x 
100 =423,, =00110100111, 。 

例 11-4 设计 一 种 定点 系统 

描述 表示 0~31 AU 的 距离 所 需 的 位 数 ， 精 度 为 0.05 AU. 

由 于 在 这 种 表示 法 中 所 有 的 数 都 是 正 的 ， 因 此 不 需要 符号 位 。 表 示 整 数 0 ~31 仅 需 要 4 
位 。 采 用 使 入 的 表示 法 ， 需 要 0.1 AU 或 更 低 的 分 辨 率 。 由 于 2”<0.1， 使 用 4 位 作为 这 个 数 
的 小 数 部 分 。 因 此 ， 最 终 格式 是 8 位 : 4.4。 


11.2.2 运算 
就 如 同 是 整数 一 样 ， 可 以 使 用 第 10 章 中 描述 的 相同 的 算术 运算 电路 ， 在 定点 二 进 制 数 上 
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执行 4 种 基本 的 运算 。 但 需要 仔细 地 考虑 算术 运算 结果 的 范围 和 精度 ， 可 能 会 不 同 于 输入 的 范 
围 和 精度 。 

两 个 p.f 格 式 的 定点 数 相 加 得 到 的 结果 是 一 个 (p+1).f 格 式 的 定点 数 。 如 果 和 希望 将 这 个 结 
果 表 示 为 一 个 p.f 格 式 的 定点 数 ， 可 能 会 遇 到 结果 超出 了 表示 范围 的 溢出 情况 。 例 如， 考虑 用 
4.6 定点 表示 法 来 表示 的 电压 。 如 果 将 两 个 电压 相 加 ， 将 得 到 一 个 介 于 0 V 和 20 YV 的 结果 。 需 
要 用 一 个 5.6 定点 表示 法 来 表示 这 个 满 量程 。 

当 定 点 数 序 列 相 加 时 ， 这 些 数 相 加 通常 采用 较 大 的 范围 ， 然 后 按 比 例 缩放 和 舍 人 来 适应 结果 
期 望 的 范围 和 精度 。 例 如 ， 假设 有 16 个 数值 ， 希望 计 算 每 一 个 用 s4.6 定点 格式 表示 的 -10V ~ 
10 V 之 间 的 电压 之 和 。 但 是 ,已 知 和 的 结果 是 一 个 介 于 -10 和 10 之 间 的 数 。 为 了 避免 中 间 结 
果 的 任何 溢出 ， 使 用 8.6 格式 来 执行 求 和 ， 然 后 在 结束 时 再 转换 回 s4. 6 格式 。 在 某 些 情况 下 ， 
使 用 饱和 来 完成 这 个 最 终 的 转换 ， 如 果 结 果 超 出 了 可 以 表示 的 范围 ， 则 将 该 值 固 定 (clamp) 
到 最 大 的 可 以 表示 的 值 ( 见习 题 10.20). 

要 将 两 个 采用 不 同 表示 法 的 定点 数 相 加 ， 必 须 先 对 齐 两 个 数 的 二 进 制 小 数 点 。 通 常 是 将 两 
个 数 转换 为 一 种 P 和 .大 到 足以 使 得 原来 的 两 种 表示 法 重 秋 一致 的 定点 表示 法 来 实现 的 。 例 如 ， 
考虑 将 2. 3 格式 的 数 01. 101 与 3. 2 格式 的 数 101.01 相 加 。 先 将 这 两 个 数 转 换 为 3.3 格式 ， 然 
后 相 加 001. 101 +101.010, 得 到 110. 111, 

当 两 个 定点 数 相 乘 时 ， 结 果 的 位 数 是 输入 在 二 进 制 小 数 点 两 侧 的 位 数 的 两 倍 。 例 如 ， 如 果 
将 两 个 4.6 格式 的 定点 数 相 乘 ， 结 果 将 是 一 个 8. 12 格式 的 定点 数 。 假 设 将 一 个 10 V 量程 和 10 
my 精度 的 电压 信号 乘 以 量程 为 10 A 和 精度 为 10 mA 的 电流 信号 ， 这 两 个 信号 都 是 4.6 格式 。 
结果 是 一 个 8. 12 格式 的 量程 为 100 W 和 精度 为 100 pW 的 功率 信号。 

许多 信号 处 理 器 将 数 按 比例 缩放 为 0. 16 格式 (或 对 于 带 符号 数 为 0.15), 。 两 个 0. 16 格式 
的 数 相 乘 得 到 一 个 0. 32 格式 的 数 。 通 常 的 操作 是 取 两 个 0. 16 格式 的 向 量 的 点 积 。 为 了 人 允许 进 
行 这 种 操作 而 又 不 丢失 精度 ， 许 多 通用 的 信号 处 理 器 采用 40 位 累加 器 。 它 们 累积 多 达 256 个 
0.32 格式 的 乘法 运算 结果 ， 得 到 8. 32 格式 的 和 (对 于 带 符号 数 ， 结 果 为 38. 30 格式 )。 然 后 常 
常 对 该 和 进行 按 比 例 缩放 和 舍 入 以 获 得 0. 16 格式 的 最 终结 果 。 

在 大 多 数 情 况 下 ， 计 算得 到 的 高 精度 结果 最 终 必须 要 舍 入 到 最 初 的 精度 上 。 舍 人 就 是 通过 
舍弃 一 个 数 的 最 右边 的 一 些 位 来 降低 该 数 的 精度 的 过 程 。 当 将 十 进 制 数 合 入 到 最 接近 的 整数 
时 ,我 们 知道 如 果 下 一 位 数 是 5 或 更 大 ， 应 该 向 上 伟人 ， 如 果 是 4 或 更 小 ， 应 该 向 下 舍 去 。 二 
进 制 舍 人 的 工作 方式 相同 。 如 果 舍 弃 的 最 高 有 效 位 是 1， 则 舍 人 和 人， 如 果 是 0， 则 侈 去 。 例 如 ， 


”0.8 格式 的 数 . 10001000 被 舍 人 为 0.4 格式 的 .1001， 而 0.8 格式 的 .10000111 $ À #l 0.4 格式 


的 .1000。 在 向 上 侈 人 时 ， 侈 人 需要 一 个 加 法 〈 或 至 少 加 1) 来 增加 结果 ， 因 此 它 不 是 一 个 不 
受 约束 的 操作 。 舍 入 有 可 能 会 改变 所 有 的 剩余 位 。 例 如 ， 在 0.8 格式 的 .01111000 舍 人 到 0.4 
格式 ， 得 到 . 1000。 


例 11-5 定点 数 运算 
将 52.3 格式 的 数 010. 001 Fo s0. 4 格式 的 数 0. 1011 相 加 、 相 减 和 相 乘 ， 使 结果 保持 满 精 度 。 
首先 ， 在 对 齐 二 进 制 小 数 点 之 后 做 加 法 ; 
010. 0010 
+ 000. 1011 
010. 1101 
减 去 0. 1011， 就 是 加 上 0. 1011 的 2 的 补 码 : 1.0101。 如 果 要 对 齐 该 值 ， 必 须 对 这 个 数 进 
行 符 号 扩展 : 
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010. 0010 
+ 111.0101 
001.0111 





后 ， 计 算 乘 法 : 
00010. 001 
x 0000. 1011 
000010001 
000100010 
+ 010001000 
010111011 
乘积 的 最 终 格式 为 32.7: 001.0111011,. 


11.3 浮 点 数 


11.3.1 表示 方法 


高 动态 范围 (high-dynamic-range, HDR) 数 常用 浮 点 格式 表示 。 尤 其 是 ， 当 需要 一 个 固定 
比例 的 (而 不 是 绝对 的 ) 精度 时 ， 浮 点 格式 用 于 表示 一 个 数 是 有 能 力 的 。 

浮 点 数 有 两 个 组 成 部 分 : 指数 (也 称 阶 码 一 一 译 者 注 ) e 和 尾数 m。 由 浮 点 数 表示 的 值 由 
下 式 给 出 : 








v= m 2 (11-7) 
其 中 , m 是 一 个 二 进 制 小 数 ,，e 是 一 个 二 进 制 整数 ，x 是 指数 上 的 一 个 偏 移 值 ， 用 于 居中 动态 范 
Fil, 3k m 是 一 个 小 数 ， 意 味 着 二 进 制 小 数 点 在 m 的 MSB 的 左边 。 指 数 e 是 一 个 整数 ， 二 进 制 
小 数 点 在 其 LSB 的 右边 。 如 果 m 的 位 是 m... v, m, e 的 位 是 e_, ，…，e。， 值 由 下 式 给 出 : 


v= Smo" x 2 (11-8) 


我 们 将 a 位 尾数 和 位 指数 的 浮 点 数 制 系统 称 为 aEb 格式 。 例 如 ，5 位 尾数 和 3 位 指数 的 
数 制 是 5E3 数 制 。 我 们 还 将 使 用 符号 “下 ”去 书写 数字 。 人 例如， 尾数 为 10010 和 指数 为 011 的 
5E3 格式 的 数 为 10010E011。 假设 偏 移 为 0， 则 该 数 的 值 为 w=18/32 x8 =4.5。 

我 们 还 可 以 将 4.5 表示 为 01001E100 (9/32 x16)。 大 多 数 浮 点 数 制 系统 不 允许 采用 4.5 的 
第 二 种 表示 方法 ， 通 过 将 尾数 不 断 地 左 移 (并 递减 指数 ) 直到 尾数 的 MSB 是 1 或 者 指数 是 0 
来 规格 化 所 有 的 浮 点 数 。 使 用 规格 化 的 数字 ,我们 可 以 通过 简单 地 逐 位 比较 两 个 数 来 快速 地 检 
查 两 个 数 是 否 相 等 。 如 果 数 是 未 规格 化 的 ， 必 须 先 将 它们 进行 规格 化 (或 至 少 对 齐 ) ， 然 后 才 
能 进行 比较 。 一 些 数 制 系统 利用 规格 化 的 优点 来 省 略 尾数 的 MSB， 因 为 它 几 乎 总 是 1 (见习 题 
11.23), 

通常 ， 在 存储 浮 点 数 时 ， 指 数 存储 在 尾数 的 左边 。 例 如 ，11001E011 按 8 位 存储 时 为 
01111001。 只 要 对 数字 进行 过 规格 化 ， 将 指数 存储 到 左 侧 则 允许 将 整数 比较 用 在 浮 点 数 上 。 也 
就 是 说 ， 对 于 两 个 浮 点 数 wc Hb, WRa>b, Wi >i, HP i, 和 分 别 是 a 和 6b 的 整数 位 。 

如 果 我 们 想 要 表示 带 符号 的 数值 ， 通 常 在 指数 的 左边 添加 一 个 符号 位 。 例 如 ， 在 8 位 中 ， 
我 们 可 以 表示 一 个 ME3 格式 的 数 ， 从 左 到 右 包 含 1 个 符号 位 , 3 个 指数 位 ， 然 后 是 4 个 尾数 位 
(SEEEMMMM) 。 在 这 种 表示 方法 中 ,位 串 11001001 表示 -9E4 或 ( 偏 移 为 0) -9/16 x2" = -9。 

浮 点 数 只 是 应 用 到 二 进 制 数 的 科学 计数 法 。 如 同 科学 计数 法 一 样 ， 浮 点 数 的 误差 与 数 的 大 
小 成 正比 。 出 于 这 个 原因 ， 浮 点 数 是 一 种 按照 指定 比例 的 精度 来 表示 数值 的 有 效 方式 ， 尤 其 是 
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当 所 讨论 的 数值 具有 高 动态 范围 时 。 

例如 ， 假 设 我 们 需要 按照 1% 的 准 度 表 示 从 1 ns 到 1000 s 的 时 间 。 在 这 个 范围 的 低 端 ， 需 
要 10 ps 的 准 度 ， 而 在 这 个 范围 的 高 端 ， 需要 表示 1000 s， 即 是 低 端 需要 的 准 度 的 10 倍 。 定 点 
表示 法 将 需要 46 位 〈10.36) 来 表示 具有 10 ps 精度 (20 ps 的 分 辨 率 ) 的 1000 s。 使 用 浮 点 
数 ， 我 们 可 以 利用 这 样 的 事实 ， 即 在 该 范围 的 高 端 ， 只 需要 10 s 的 精度 (20 s 的 分 辩 率 ) H 
此 ， 尾 数 仅 需 要 6 位 。 通 过 使 用 6 位 指数 来 表示 2” 的 范围 ， 将 可 以 覆盖 这 个 大 的 动态 范围 
(10° <2") 。 将 指数 偏 移 〈 公 式 (11-7) 中 的 x) 设置 为 54， 所 以 我 们 表示 的 数 可 以 高 达 2"。 
因此 ， 可 以 使 用 12 位 的 6E6 格式 的 浮 点 数 实现 与 使 用 46 位 的 10. 36 格式 的 定点 数 相 同 的 相对 
精度 。 

如 同 未 按 比例 缩放 的 定点 数 ， 二 进 制 浮 点 数 不 能 精确 地 表示 任意 的 十 进 制 数 ， 因 为 1/10 
不 能 精确 地 表示 为 有 限 长 度 的 二 进 制 小 数 。 例 如 ， 在 二 进 制 中 像 0.3 这 样 的 值 只 能 用 近似 值 。 
这 个 近似 值 可 以 通过 增加 尾数 的 位 数 来 提高 精度 ,但 始终 会 存在 误差 。 在 误差 必须 为 零 的 应 用 
中 ， 必 须 使 用 BCD 码 或 按 比例 缩放 表示 法 。 
例 11-6 浮 点 数 设 计 

设计 一 个 浮 点 数 表示 法 来 表示 1x10- 到 1x107 的 测量 值 ， 误差 为 5%。 用 这 种 格式 表示 
数值 4.5。 

在 我 们 的 表示 法 中 ， 总 共 需 要 5 位 尾数 来 表示 最 高 有 效 位 为 1， 并 且 尾 数 的 其 余部 分 表示 
所 需 的 精度 。 要 表示 的 最 小 数 是 1X2 ”， 而 最 大 数 是 1 x2”。 在 指数 中 ， 需 要 一 个 至 少 是 M 
(需要 6 位) 的 范围 ， 指 数 偏 移 为 20。 

注意 ,4.5 等 于 0. 10010 x2 。 在 我 们 的 格式 中 ， 它 表示 为 : 10010E010111 。 


11.3.2 ”未 规格 化 数 和 逐 级 下 浇 


如 果 我 们 禁止 所 有 未 规格 化 数 ， 在 表示 函数 中 会 有 一 个 很 大 的 分 歧 ， 因 为 最 接近 0 的 数 可 
以 表示 (例如 在 4E3 中 ) X 1000E000, 没有 偏 移 时 表示 0.5。 这 对 于 小 于 0.5 的 数 给 出 了 一 个 
大 的 相对 误差 。 我 们 可 以 通过 仅 允 许 指数 为 0 的 未 规格 化 数 来 减少 这 个 相对 误差 。 然 后 ,我 们 
可 以 将 1/4 表示 为 0100E000， 将 1/8 表示 为 0010E000， 将 1/16 表示 为 0001E000。 在 这 种 情况 下 ， 
较 小 的 数 的 误差 幅度 减 小 了 8 倍 。 通 常 ， 对 于 具有 位 尾数 的 、 较 小 的 数 的 误差 减少 了 2"' 倍 。 

这 种 表示 方法 通常 被 称 为 逐 级 下 溢 ， 因 为 它 减 少 了 由 于 下 溢 引 起 的 误差 ， 即 当 算术 运算 给 
出 的 结果 比 可 以 表示 的 最 小 数 更 接近 0 时 。 这 就 解决 了 相同 的 数 有 多 种 表示 方法 的 问题 。 因 为 
这 些 未 规格 化 数 被 限制 到 了 指数 为 0， 因 此 每 个 值 仅 有 一 种 表示 方法 。 

为 了 简化 表示 方法 ， 在 这 里 描述 的 算术 单元 并 不 支持 逐 级 下 洲 。 我 们 将 这 种 支持 逐 级 下 游 
的 扩展 的 表示 方法 留 作 习题 11.29 和 习题 11.30. 


11.3.3 浮 点 数 乘法 


浮 点 数 相 乘 很 简单 : 仅 需 将 尾数 相 乘 并 将 指数 相 加 。 这 样 将 使 得 尾数 的 位 数 翻 倍 ， 指 数 的 
位 数 增加 。 我 们 通常 通过 舍 人 尾数 (如 11.2.2 节 所 述 ) 并 舍弃 经 由 指数 相 加 所 产生 的 附加 位 
来 得 到 一 个 与 输入 格式 相同 的 结果 。 当 舍 人 尾数 时 ， 考 虑 到 舍弃 的 位 则 必须 调整 指数 。 如 果 有 
指数 偏 移 ， 为 了 弥补 两 次 使 用 偏 移 所 带 来 的 影响 还 必须 调整 指数 。 如 果 在 指数 没有 附加 位 的 情 
况 下 不 能 表示 该 数 时 ， 则 发 出 溢出 信号 。 舍 人 尾数 所 带 来 的 尾数 增加 可 能 会 导致 一 个 进位 到 下 
一 个 尾数 位 。 如 果 发 生 这 种 情况 ， 尾 数 将 再 次 右 移 ， 指 数 相应 增加 。 

例如 ， 考 虑 将 101E011 (5) 乘 以 101E100 (10), HRH 3E3 格式 ， 无 偏 移 。 目 的 是 得 到 一 
个 相同 格式 的 规格 化 结果 。 输 入 是 101E011 和 101E100， 先 将 尾数 101 和 101 相 乘 得 到 011001 
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(25/64)， 然 后 将 指数 011 和 100 相 加 得 到 111 (7o) 。 事 实 上 ， 这 就 是 正确 的 答案 : 25/64 x2’ = 
50。 现 在 需要 将 这 个 结果 转换 回 3E3 格式 。 

为 了 得 到 3 位 规格 化 尾数 ， 将 尾数 左 移 1 位 并 舍弃 最 低 两 位 。 指 数 通 过 减 1 调整 到 110。 
因为 被 舍弃 的 最 高 有 效 位 是 0， 所 以 舍 入 不 需要 尾数 增加 。 因 此 ， 按照 原来 的 格式 我 们 的 结果 
是 110E110 (6/8 x2 =48)。 在 这 里 ,误差 为 2 是 由 于 舍 人 期 间 舍弃 尾数 的 LSB 造成 的 。 


例 11-7 浮 点 数 乘法 ae be am bm 
将 下 列 两 个 指数 偏 移 为 4 的 4E3 HAMMAR: 
1100E010 x 1100E110 
首先 通过 对 两 个 输入 指数 求 和 (1000,) 再 减 去 偏 移 
(100,) 得 到 一 开始 的 输出 指数 100,。 接 下 来 ， 将 两 个 尾数 
相 乘 ， 得 到 0. 10010000, % 0.1001, 的 乘积 。 因 为 不 需要 规 
格 化 ， 最 终 答案 是 1001E100 。 


图 11-1 给 出 了 一 个 浮 点 乘法 器 的 框图 ， 该 乘法 器 的 
Verilog 描述 如 图 11-2 所 示 。 图 中 的 FF1 块 得 到 pm (乘法 
器 的 乘积 输出 ) 的 最 左边 1 位 。 因 为 两 个 输入 都 是 规格 化 
的 ， 所 以 确保 这 位 是 该 乘积 左边 两 位 中 的 1 人 位。 因此， 可 
以 直接 使 用 pm [7] 来 选择 pm 中 哪 一 组 的 4 位 作为 sm, 
即 移 位 后 的 乘积 9 信号 rna (pm 的 第 一 个 舍弃 位 ) 用 于 
确定 是 否 需 要 舍 人 增 量 。 信 和 号 xm (伟人 后 的 sm) 是 一 个 5 
位 信号 。 像 bm 一 样 ， 它 确保 在 其 最 高 有 效 的 两 位 之 一 中 有 
一 个 1。 因 此 ,我 们 使 用 其 最 高 有 效 位 xm [4] 来 选择 哪 
一 组 4 位 数 作为 输出 的 规格 化 尾数 。 请 注意 ， 我 们 确保 在 这 
最 终 的 移 位 之 后 不 再 需要 另外 的 舍 人 ， 因 为 如 果 xm [4] 为 图 11-1 具有 3H4 格式 的 输入 和 
1, Wxm [0] 保证 为 0 (见习 题 11. 26)。 输出 的 浮 点 乘法 器 





ovf ce 


module FP Mul(ae, am, be, bm, ce, cm, 
parameter e = 3 ; 
input [e-1:0] ae, be ; // 输入 的 指数 
input [3:0] am, bm; // 输入 的 尾数 
output [e-1:0] ce ; // 结果 的 指数 
output [3:0] cm ; // 结果 的 尾数 
output ovf ; // 溢出 指示 


wire [7:0] pm ; // 一 开始 的 相 乘 结果 

wire [3:0] sm ; // 移 位 后 

wire [4:0] xm ; // 增加 后 

wire rnd ; // 最 高 有 效 位 移 位 后 为 1 ， 则 为 true 
wire [1:0] oe ; // 检测 指数 ovf 


// am 和 bm 相 乘 
Mul4 mult(am, bm, pm) ; 





图 11-2 浮 点 数 乘法 器 的 Verilog 描述 


O 在 这 种 情况 下 ，FF1 块 仅仅 选择 pm 输出 的 1 位 ， 如 Verilog 中 所 示 。 然 而 ， 对 于 未 规格 化 的 数 来 说 ， 需 要 一 个 
完整 的 优先 级 编码 器 功能 。 
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// BIRA: HMSBH1, 选择 第 7:4 位 ， 否 则 选择 第 6:3 位 
assign sm = pm[7] ? pm[7:4] : pm[6:3] ; 
assign rnd = pm[7] ? pm[3] : pm[2] ; 


// 增加 


assign xm = sm + rnd ; 


// 最 后 的 移 位 / 合 入 


assign cm = xm[4] ? xm[4:1] : xm[3:0] ; 


// 指数 相 加 
assign {oe, ce} ae + be + (pm[7] | xm[4]) - 1 ; 
assign ovf 

endmodule 





图 11-2 (4%) 


11.3.4 浮 点 数 加 /减法 


由 于 需要 对 齐 输入 和 规格 化 输出 ， 因 此 浮 点 数 加 法 比 乘法 稍微 复杂 一 些 。 该 过 程 有 三 个 步 
DE: 对 齐 、 相 加 和 规格 化 。 在 对 齐 这 一 步 ， 指 数 较 小 的 数 的 尾数 右 移 ， 使 其 与 指数 较 大 的 数 的 
尾数 对 准 ， 即 权重 相同 的 位 彼此 对 齐 。 一 旦 两 个 尾数 对 齐 ， 就 如 同 整数 一 样 ， 可 以 将 它们 相 加 
或 相 减 。 该 加 法 可 能 会 产生 一 个 未 规格 化 的 结果 。 加 法 的 进位 输出 可 能 会 导致 尾数 必须 右 移 1 
位 ， 将 最 高 有 效 的 1 放 到 结果 的 MSB 中 。 另 外 ,减法 可 能 需要 左 移 若干 位 来 移 掉 结 果 中 若干 
个 为 0 的 MSB， 以 将 最 高 有 效 的 1 置 于 结果 的 MSB 中 。 规 格 化 这 一 步骤 是 要 找到 结果 的 最 高 
有 效 的 1， 将 结果 移 位 到 将 这 个 1 放 到 尾数 的 MSB 中 ， 并 相应 地 调整 指数 。 如 果 规 格 化 是 右 
移 ， 则 它 可 能 会 舍弃 结果 的 一 个 LSB。 舍 弃 此 位 时 ， 舍 人 的 增 量 需要 舍 人 ， 而 不 是 截断 。 

作为 一 个 浮 点 数 加 法 的 例子 ， 假 设 希 望 将 采用 5E3 表示 法 表示 的 5 和 11 相 加 。 在 这 种 表示 
法 中 ,数字 5 是 10100E011， 数 字 11 是 10110E100。 在 对 齐 这 一 步 ， 将 5 的 尾数 右 移 1 位 ,使 
其 与 尾数 11 对 齐 。 实 际 上 ,把 5 改写 为 01010E100 ， 即 未 规格 化 的 尾数 ， 让 该 指数 与 另 一 个 
数 的 指数 一 致 。 在 两 个 尾数 对 齐 的 情况 下 ， 现 在 可 以 将 尾数 相 加 。 尾 数 相 加 有 一 个 进位 输出 ， 
得 到 的 结果 是 6E3 格式 的 100000E100。 为 了 规格 化 这 个 结果 ， 使 其 符合 5E3 格式 ， 将 尾数 右 
移 1 位， 然后 指数 增 1， 得 到 最 终结 果 10000E101 或 16。 

作为 第 二 个 例子 ， 考 虑 10 减 去 9， 二 者 都 以 55E3 格式 表示 。 此 时 , 9 是 + 10010E100，10 
是 +10100E100。 这 两 个 数字 具有 相同 的 指数 ， 它 们 已 经 对 齐 ， 在 做 减法 之 前 无 须 移 位 。 两 个 
数 相 减 得 到 未 规格 化 的 00010E100。 为 了 规格 化 这 个 数 ， 将 尾数 左 移 3 位 ， 然 后 指数 减 3， 得 
到 10000E001 或 1。 

在 加 法 和 减法 之 前 对 齐 浮 点 数 会 导致 舍弃 在 较 大 的 数 的 LSB 更 远 处 的 一 些 位 。 因 此 ， 浮 点 
运算 是 不 符合 结合 律 的 。 例 如 ， 考 虑 将 一 个 小 的 数值 和 一 个 大 的 数值 4 相 加 。 如 果 4 足够 
小 ， 则 5+4 =4。 如 果 从 这 个 和 中 再 减 去 4， 会 发 现 (b+4) -4 =0。 先 前 的 减法 给 出 了 不 同 的 
ER: b+(A-A) =b, 


例 11-8 浮 点 数 加 减法 
将 下 列 写 成 4E3 格式 的 浮上 点 数 相 加 和 相 减 ， 偏 移 为 4: 
1100E100 + 1110E011; 1100E100 - 1110E011 
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要 执行 加 法 ， 必 须 先 将 较 小 的 数 移 位 来 对 齐 二 进 制 小 数 点 : 
0. 1100E100 
+ 0. O111E100 
= 1.0011E100 
= 1010E101 
做 完 加 法 之 后 ， 必 须 对 和 进行 规格 化 ， 在 移出 一 个 1 之 后 向 上 舍 入 。 
减法 遵循 类 似 的 方法 ,但 是 加 上 减 数 移 位 后 的 数值 的 2 的 
补 码 : 
0. 1100E100 
+ 1.1001E100 
0.0101 E100 
= 1010E011 
这 一 次 ， 差 值 必须 左 移 ， 以 获得 正确 的 答案 。 


浮 点 数 加 法 器 的 框图 如 图 11-3 所 示 ， 该 加 法 器 的 Verilog 描述 
如 图 11-4 所 示 。 输 入 指数 逻辑 比较 两 个 指数 ， 生 成 信号 agtb, 
用 来 确定 哪个 尾数 需要 移 位 ， 并 生成 信号 se， 其 给 出 要 移 位 的 位 
数 。 输 入 开关 用 agtb 来 切换 两 个 尾数 ， 指 数 较 大 的 尾数 在 信号 gm 
上 ， 而 指数 较 小 的 尾数 在 信号 Im 上 。 然 后 尾数 lm 依据 ae 来 移 位 
以 对 齐 尾数 ” 。 对 齐 的 尾数 相 加 ,产生 信和 号 sm， 其 比 尾数 宽 一 位 。 
然后 使 用 优先 级 反 转 编码 器 找到 sm 中 的 最 高 有 效 1。 然 后 执行 移 
位 将 该 位 移动 到 结果 的 最 高 有 效 的 位 置 ， 给 出 信号 nm。 该 移 位 的 
范围 从 右 移 1 位 到 左 移 整个 宽度 的 位 ， 信 号 rna 捕获 在 右 移 1 位 
时 丢弃 的 位 。 依 据 移 位 的 位 数 来 调整 指数 。 如 果 指 数 不 能 按照 给 
定 的 位 数 表示 ， 则 发 生 洲 出 。 

module FP_Add(ae, am, be, bm, ce, 

parameter e a 3 
parameter m 5 3 
// 输入 的 指数 
// 输入 的 尾数 
// 结果 的 指数 
// 结果 的 尾数 
// MwA 


wire [e-1:0] ge, le, 


input [e-1:0] ae, be ; 
input [m-1:0] am, bm ; 
output [e-1:0] ce ; 
output [m-1:0] cm ; 
output ovf ; 
de, sc ; 
wire [m-1:0] gm, lm, alm, nm ; 


wire rnd; 


// 输入 指数 逻辑 


wire agtb (ae >= be) ; 


assign ge agtb ? ae : be ; 
assign le agtb ? be : ae ; 


assign de 


图 11-4 


ge = le ; 


浮 点 数 加 法 器 的 Verilog 描述 








ovf ce cm 
图 11-3 浮 点 数 加 法 器 


cm, ovf); 


// 较 大 的 指数 
// 较 小 的 指数 
// 指数 的 差 


O ”聪明 的 读者 会 注意 到 ， 我们 在 产生 一 个 5 位 的 alm 而 不 是 6 位 的 alm 之 前 可 能 移 掉 了 一 个 侈 人 位 。 习 题 


11. 24 将 要 求 你 解决 这 个 问题 。 
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// 选择 输入 尾数 
assign gm = agtb ? am : bm; // 大 指数 的 尾数 
assign Im = agtb ? bm: am; // 小 指数 的 尾数 


// 移 位 尾数 以 对 齐 
assign alm = lm>sde ; // 用 较 小 的 指数 对 齐 尾数 


// 相 加 


wire [m:0] sm = gm + alm ; 


// 找到 第 一 个 为 1 的 位 


RevPriorityEncoder #(6,3) ffl(sm, sc) ; 


// 将 其 移 位 至 MSB 


assign {nm, rnd} = sm<<sc ; 


// 调整 指数 


assign {ovf,ce} = ge - sc +1 ; 


// BAER 


assign cm = nm + rnd ; 


endmodule 





图 11-4 (#8) 


小 结 


在 本 章 中 ， 你 已 经 学 会 了 如 何 为 一 个 特定 的 应 用 选择 一 种 具有 适当 的 范围 和 准 度 的 数 制 系 
统 。 我 们 可 以 用 绝对 的 或 相对 的 关系 来 表示 一 种 表示 方法 的 误差 。 对 于 给 定 的 表示 函数 R(x)， 
可 以 计算 出 任 一 点 x 处 的 这 种 表示 方法 的 绝对 误差 和 相对 误差 。 一 种 表示 方法 的 准 度 是 在 所 要 
求 的 范围 内 的 最 大 误差 。 

定点 数 有 一 个 固定 的 二 进 制 小 数 点 ， 其 中 小 数位 在 二 进 制 小 数 点 的 右边 ， 而 整数 位 在 其 左 
边 。 例 如 ,一 个 s1. 14 格式 的 数 是 一 个 16 位 数 ， 其 中 !1 位 符号 位 ， 二 进 制 小 数 点 左边 的 1 位 整 
数位 ， 二 进 制 小 数 点 右边 的 14 位 小 数位 。 在 这 种 s1. 14 表示 方法 中 ，LSB 的 权重 为 2“。 定 点 
数 的 运算 要 比 浮 点 数 的 运算 简单 ， 如 果 恰 当地 按 比例 缩放 ， 它 们 会 有 好 的 绝对 准 度 。 

用 浮 点 数 表示 的 值 是 z=m x2"“， 其 中 m 是 尾数 ,，e 是 指数 ,x 是 偏 移 值 。m RA “AA 
允许 m 中 的 二 进 制 小 数 点 浮动 的 效果 ， 因 此 得 名 。 浮 点 数 的 运算 比 整数 更 为 复杂 ， 因 为 在 相 加 
之 前 需要 对 齐 尾数 ， 以 使 相对 应 的 位 具有 相同 的 权重 。 浮 点 数 的 优势 是 : 对 于 给 定 的 位 数 和 所 
要 求 的 范围 ， 它 们 比 定点 数 具 有 更 大 的 相对 准 度 。 浮 点 数 也 允许 设计 人 员 偷 个 懒 ， 不 按 比例 缩 
放 变 量 。 浮 点 数 较 大 的 覆盖 范围 允许 设计 人 员 将 按 比 例 缩放 推迟 给 硬件 。 

为 了 让 每 一 个 数值 具有 单一 的 表示 方法 ， 通 常 通过 不 断 地 将 尾数 左 移 直 到 尾数 的 MSB 为 1 
(并 相应 地 递减 指数 ) 来 规格 化 浮 点 数 。 由 于 尾数 的 MSB 总 为 1， 我 们 常常 省 略 它 ， 我 们 称 为 
隐 含 的 1。 为 了 允许 准确 地 表示 较 小 的 数 ， 在 指数 为 0 时 ， 人 允许 使 用 未 规格 化 数 ， 称 为 逐 级 
Tš 

浮 点 数 乘法 通过 将 指数 相 加 和 尾数 相 乘 来 完成 。 相 乘 的 结果 必须 舍 人 以 满足 输出 位 数 的 要 
求 ， 然 后 规格 化 ， 以 便 输出 的 最 高 有 效 位 为 1。 

浮 点 数 加 法 运算 要 求 先 通 过 右 移 指数 较 小 的 尾数 来 对 齐 尾数 ， 以 使 相对 应 的 位 具有 相同 的 


RIL LARP F AH 181 





权重 。 





在 相 加 之 后 ， 必 须 对 结果 进行 规格 化 ， 即 移 位 结果 ， 使 得 移 位 后 的 结果 的 MSB 为 1， 并 


且 相 应 地 调整 指数 。 


文献 说 明 
有 关 浮 点 格式 的 更 多 信息 ， 请 参考 IEEE 浮 点 标准 [55] 和 [53], 
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11.11 


11.12 


11.13 
11.14 
11.15 
11. 16 


点 表示 ， 工 。 将 下 列 定点 数 转 换 到 十 进 制 : 1.4 格式 的 1.0101。 

表示 ， 开 。 将 下 列 定点 数 转换 到 十 进 制 : s1.4 格式 的 11.0101, 

表示 ， 亚 。 将 下 列 定点 数 转换 到 十 进 制 : 3.3 格式 的 101. 011。 

表示 ，K 。 将 下 列 定点 数 转换 到 十 进 制 : s2.3 格式 的 101.011。 

表示 ， 工 。 将 1. 5999 转换 为 最 接近 的 定点 数 1.5 表示 ， 并 给 出 绝对 误差 和 相对 误差 。 

表示 ， 开 。 将 0.3775 转换 为 最 接近 的 定点 数 1.5 表示 ， 并 给 出 绝对 误差 和 相对 误差 。 

定点 表示 ， 亚 。 将 1. 109375 转换 为 最 接近 的 定点 数 s1.5 表示 ， 并 给 出 绝对 误差 和 相对 误差 。 

定点 表示 ，K 。 将 -1. 171875 转换 为 最 接近 的 定点 数 1.5 表示 ， 并 给 出 绝对 误差 和 相对 误差 。 

定点 表示 ， 绝 对 误差 。 找 到 一 个 介 于 -1 和 1 之 间 的 十 进 制 数值 ， 其 表示 为 s1.5 格式 的 定点 数 的 

误差 的 绝对 值 为 最 大 。 

定点 表示 ， 相 对 误差 。 找 到 一 个 介 于 0.1 和 1 之 间 的 十 进 制 数值 ， 其 表示 为 s1.5 格式 的 定点 数 的 

误差 的 百分比 为 最 大 。 

选择 定点 表示 方法 ，]。 想 要 表示 一 个 范围 从 — 10 PSI 到 10 PSI、 准 度 为 0.1 PSI 的 相对 压力 信 

号 。 选 择 以 最 少 位 数 和 指定 准 度 获 盖 此 范围 的 定点 表示 方法 。 

选择 定点 表示 方法 ， 工 。 选 择 一 种 覆盖 范围 从 0. 001 到 1 的 定点 表示 方法 ， 准 度 为 1% ， 并 使 用 

最 少 位 数 。 

浮 点 表示 ， 工 。 将 下 列 偏 移 为 3 的 浮 点 数 转换 为 十 进 制 : 4F3 格式 的 1111E111。 

浮 点 表示 ， 工 。 将 下 列 偏 移 为 3 的 浮 点 数 转换 为 十 进 制 : 4E3 格式 的 1010E100, 

浮 点 表示 ， 亚 。 将 下 列 偏 移 为 3 的 浮 点 数 转换 为 十 进 制 : 53E3 格式 的 1100E001。 

浮 点 表示 ， 将 下 列 偏 移 为 3 的 浮 点 数 转 换 为 十 进 制 : s3F3 格式 的 0101E101。 

浮 点 表示 ， 工 。 将 -23 转换 到 SES 浮 点 格式 ， 偏 移 为 8， 并 给 出 相对 误差 和 绝对 误差 。 

浮 点 表示 ， E A ce an n S ns sns. 

FRAT, Mo K 999 转换 到 IES 浮 点 格式 ， 偏 移 为 16 ， 并 给 出 相对 误差 和 绝对 误差 。 

浮 点 表示 ， 久 。 将 64 转换 到 BES 浮 点 格式 ， 偏 移 为 16， 并 给 出 相对 误差 和 绝对 误差 。 

选择 浮 点 表示 方法 ， 工 。 选 择 一 种 使 用 最 少 位 数 覆 盖 范 围 从 -10 到 10 的 浮 点 表示 方法 ， 准 度 为 

1, BUH >1/32, 

选择 浮 点 表示 方法 ， 开 。 选 择 一 种 使 用 最 少 位 数 履 盖 范 围 从 0. 001 到 100 000 000 的 浮 点 表示 方 

E, MEA 1% 。 

隐 含 的 1。 许 多 浮 点 数 格 式 省 略 了 尾数 的 MSB。 也 就 是 说 ,无 须 去 存储 这 一 位 。 例 如 ,IEEE 单 精 

度 浮 点 数 标准 通过 省 略 尾 数 的 MSB 来 实现 在 23 位 的 空间 内 存储 24 位 的 尾数 。 这 被 称 为 隐 仿 的 

1。 一 些 格式 坚信 这 个 被 省 略 的 MSB 常 为 1。 但 是 ， 这 将 导致 令 人 关注 的 接近 0 的 错误 行为 。 通 

过 隐 含 为 0 的 尾数 的 MSB， 且 当 e=0 时 指数 为 1 -x (4e=1 时 指数 相同 ) ， 可 以 获得 更 好 的 误 

差 特性 〈 在 复杂 性 上 的 一 些 成 本 ) 。 具 有 这 种 特征 的 数 制 系统 就 说 提供 了 逐 级 下 溢 。 

(a) 假设 你 有 一 个 5E3 浮 点 数 制 系统 ， 偏 移 x 为 0， es 面 紧 跟着 
的 4 位 组 成 ) 。 对 于 不 支持 逐 级 下 滋 的 数 制 系统 ,在 区 间 [ -2, 2] 上 绘制 误差 曲线 。 

(b) 在 与 (a) 相同 的 坐标 轴 上 ， 绘制 同 一 个 数 制 系统 的 误差 曲线 ， 但 支持 逐 级 下 溢 。 

(c) 对 于 不 支持 逐 级 下 溢 的 数 制 系统 ， 哪 个 值 的 百分比 误差 最 大 ? 

(d) 是 否 有 一 个 取 值 范围 ， 其 中 支持 逐 级 下 洲 的 数 制 系统 比 不 支持 逐 级 下 溢 的 数 制 系统 具有 更 


Z 
= 点 
= 点 
= 点 
定点 
定 点 
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大 的 误差 ? 如 果 有 ， 这 个 范围 是 多 少 ? 

带 有 侈 入 位 的 浮 点 数 加 法 。 修 改 图 11-3 的 框图 和 图 11-4 的 Verilog 说 明 可 能 舍弃 lm 的 伟人 位 的 
原因 。 例 如 ，1. 0000 x2° +1.1111 x2 一 应 输出 1.0000 x2 (M1. 11111 x2° 2 A) 而 不 是 1.1111 x 
2 。 新 建 一 个 连 线 guard， 表 示 该 位 在 alm 的 LSB 的 右边 ， 并 将 其 加 到 和 sm 中 (如 果 已 经 设 
置 ) 。 

浮 点 数 减法 。 扩 展 图 11-3 和 图 11-4 所 示 的 浮 点 加 法 器 ， 使 其 能 够 处 理 带 符号 的 浮 点 数 并 执行 浮 
点 数 减法 。 假 设 每 个 输入 操作 数 的 符号 位 由 各 自 的 线路 as 和 bs 提供 ， 结 果 的 符号 位 要 输出 在 
线路 cs 上 。 

浮 点 数 乘 法 。 在 11.3.3 节 中 曾 指 出 : 如 果 舍 人 的 乘积 xm 的 MSB 是 1， 则 它 的 LSB 一 定 是 0。 然 
而 ， 并 没有 为 这 一 断言 给 出 任何 的 理由 。 请 你 证 明 这 断言 是 真 的 。 

支持 未 规格 化 数 的 浮 点 数 乘法 。 修 改 11.3.3 节 的 浮 点 数 乘法 器 的 设计 ， 使 其 能 够 处 理 未 规格 化 
输入 。 

支持 下 溢 的 浮 点 数 加 法 。 两 个 规格 化 浮 点 数 相 加 可 能 会 导致 不 能 表示 一 个 在 尾数 的 MSB 中 是 1 
的 数 ， 但 也 不 是 0。 这 种 情况 就 是 下 溢 。 修 改 11.3.4 节 的 加 法 器 ， 使 其 能 够 检测 和 标志 一 个 下 滋 
支持 逐 级 下 溢 的 加 法 。 扩 展 11.3.4 节 的 加 法 器 设计 ， 使 其 能 够 处 理 逐 级 下 洲 。 也 就 是 说 ， 当 指 
数 为 0 时 能 处 理 未 规格 化 输入 。 

支持 逐 级 下 溢 的 乘法 。 扩 展 11.3.3 节 的 乘法 器 设计 ， 使 其 能 够 处 理 逐 级 下 溢 。 

逐 级 下 溢 和 隐 含 的 1。 考虑 一 种 如 习题 11.23 所 描述 的 数 制 系统 ， 其 采用 在 尾数 的 MSB 中 具有 隐 
含 的 1 的 表示 方法 。 扩 展 这 种 数 制 系统 使 其 能 支持 逐 级 下 洲 的 数 。 确 保 没 有 在 数 制 系统 中 创建 任 
何不 足 或 元 余 的 表示 (提示: 让 0 和 1 的 指数 表示 相同 的 值 ， 但 其 中 一 个 具有 隐 含 的 1， 而 男 一 
个 没有 ) 。 将 下 列 数字 转换 为 4E3 格式 的 表示 形式 : 

(a) 1/8 

(b) 4 

(c) 1/16 

(d) 32 

LIAA T BABS 1 的 加 法 。 扩 展 11.3.4 节 的 加 法 器 设计 ， 使 其 能 够 处 理 具 有 一 个 隐 含 的 1 
HER PF tt (习题 11.31). 

支持 逐 级 下 溢 和 隐 仿 的 1 的 乘法 。 扩 展 11.3.3 节 的 乘法 器 设计 ， 使 其 能 够 处 理 具有 一 个 隐 含 的 1 
的 逐 级 下 溢 (习题 11.31). 

对 数 的 表示 方法 。 考 虑 一 种 数 制 系统 ， 对 于 一 个 固定 的 基数 b， 有 w=4b“。 该 数 制 系统 类 似 于 浮 点 
数 表示 法 ， 其 中 尾数 常 为 1， 因 此 被 省 略 。 考 虑 5=2” 的 特殊 情况 。 假 设 必 须 表 示 1 pV 至 1 MV 
的 电压 ， 相 对 准 度 为 5% 。 这 种 表示 法 与 定点 数 和 浮 点 数 表示 法 相 比 ， 在 需要 的 位 数 方面 有 何 
区 别 ? 
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在 本 章 中 ， 我 们 着 眼 于 提高 算术 电路 速度 的 三 种 方法 ， 尤 其 是 乘法 器 。 在 12. 1 节 中 ,我 
们 从 再 次 讨论 二 进 制 加 法 器 开始 ， 然 后 看 看 如 何 通过 使 用 分 级 的 超前 进位 电路 将 它们 的 延迟 从 
0(n) 减 少 到 0(log(n))。 这 种 技术 可 以 直接 用 于 构建 快速 加 法 器 ， 而 且 还 可 以 用 于 加 速 乘法 
融 中 的 部 分 积 的 求 和 。 在 12. 2 节 中 ,我们 看 到 如 何 通过 将 一 个 输入 重新 编码 为 一 个 更 高 基数 
的 带 符号 数 ， 可 以 大 大 减少 需要 在 乘法 器 中 求 和 的 部 分 积 的 个 数 。 最 后 ,在 12.3 WP, RAT 
将 了 解 到 如 何 用 全 加 器 树 来 累加 带 有 O(log(n) ) 延迟 的 部 分 积 。 将 这 三 种 技术 组 合 到 一 个 快速 
乘法 器 中 ， 留 作 习题 12. 17 ~ 习题 12. 20。 


12.1 超前 进位 

回忆 一 下 ， 由 于 在 进位 信号 上 的 传递 一 位 接着 一 位 ， 
可 以 形成 行 波 ， 影 响 到 和 的 MSB 的 最 终 值 ， 因 此 将 10.2 
节 中 开发 的 加 法 器 称 为 行 波 进位 加 法 器 。 这 种 行 波 进位 
将 导致 加 法 器 的 延迟 随 加 法 器 的 位 数 呈 线性 增加 。 对 于 
大 型 的 加 法 器 ， 这 种 线性 延迟 会 变 得 过 大 。 

我 们 采用 如 图 12-1 所 示 的 双 树 结构 可 以 构建 一 个 延 
迟 随 加 法 器 的 宽度 呈 对 数 增加 而 不 是 线性 增加 的 加 法 器 。 
该 电路 通过 计算 上 面 树 中 的 每 一 组 的 进位 传递 和 进位 生 
成 ， 然 后 使 用 这 些 信号 来 产生 进入 下 面 树 中 的 每 一 位 的 
进位 信号 。 如 果 进 到 第 i 位 的 进位 将 从 第 i 位 传递 到 第 j 
fi, 并且 生成 了 第 j 位 的 进位 输出 ， 则 传递 信号 p; 为 真 。 
无 论 是 否 有 进 到 第 i 位 的 进位 ， 如 果 生 成 了 第 j 位 的 进位 
输出 ， 则 生成 信号 gj 为 真 。 可 以 将 p A g 递归 地 定义 
如 下 : 


Py = Pi Apaay( Vk: i < k < j) (12-1) 
Pi = Pi = a, @ b, (12-2) 
g; = (gn A p(k +1)j) V gaay( V k:i < k < j) (12-3) 
Ba] = & = a, A b, (12-4) 


前 两 个 公式 定义 了 传递 信 叶 。 如 果 进 位 信号 从 第 ;位 传 
递 到 第 k(p,) 位， 然后 再 从 第 +1 位 传递 到 第 jp ) Seer an 
位 ， 则 进位 信号 将 在 第 i 位 到 第 j 位 的 范围 内 传递 。k 可 图 12-1 超前 进位 电路 框图 。 每 个 pg 信 
以 是 ;到 六 -1 之 间 的 任 一 值 。 当 然 ， 通 常会 平分 这 个 区 a ea Erig 


cet AR a i Sg 2 i 进位 在 指定 的 位 范围 内 传递 ， 
lal fal Ba, BERRA =| (i+j)/2|, BAK 10-3 所 讨论 的 内 z 位 指明 进位 在 指定 的 位 范围 








容 ， 当 这 个 区 间 间 隔 只 剩 下 1 位 时 ， 则 计算 p;， 或 仅 计 之 外 生成 。pg 信号 合并 在 位 范 
算 p;。 当 恰好 只 有 1 位 输入 时 ， 进 位 传递 到 单独 的 第 i 位 国 不 断 增加 的 一 棵 树 上 。 然 后 
上 则 该 位 为 真 ( 即 当 ai@bi 时 )。 pg 信号 在 另 一 棵 树 上 用 来 生成 


第 一 个 生成 公式 表明 ， 如 果 1) 无 论 进 到 第 i 位 的 进 每 一 位 的 进位 信号 c 
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位 如 何 ， 都 从 第 位 产生 一 个 进位 信和 号， 然后 进位 信号 从 第 +1 位 传递 到 第 j 位 ,或 者 2) 无 
论 进 到 第 +1 位 的 进位 如 何 ， 都 从 第 j 位 产生 一 个 进位 信号 。 生 成 的 基本 情况 在 图 10-3 中 讨 
论 过 。 仅 当 该 进位 的 两 个 输入 都 是 高 电 平 时 ， 才 产生 一 个 1 位 的 进位 。 

使 用 公式 (12-1) ~ 公式 (12-4) 很 容易 构造 出 图 12-1 的 进位 电路 的 上 面部 分 。 对 于 图 
中 的 8 位 进位 电路 ， 我 们 想 要 知道 进位 输出 的 第 7 位 cs 是 什么 。 因 此 ， 要 计算 poy 和 go。 为 了 
简化 绘图 ， 我 们 将 这 两 个 信号 统称 为 pgo;， 选 择 上 =3， 然 后 由 peo, Ml pgs 计算 pgw。 标 记 为 PG 
的 块 的 逻辑 是 公式 (12-1) 和 公式 (12-3) 的 逻辑 ， 如 图 12-2 所 示 。 然 后 ， 反 复 不 断 地 细 分 
每 一 个 区 间 间 隔 ， 一 直到 最 小 1 位 的 p 和 gg 项 。 

一 旦 递归 地 生成 了 可 信 号 ， 便 可 以 使 用 这 些 信号 来 生成 进位 信号 。 我 们 继续 构建 一 棵 树 ， 
从 所 有 的 8 位 的 进位 开始 ， 然 后 是 4 位 一 组 、2 位 一 组 和 1 位 一 组 。 由 前 一 级 的 进位 信号 和 pg 
信和 号 来 计算 每 一 级 的 进位 信号 ， 如 下 式 所 示 : 

Cin = É; V (e, A P;) (12-5) 

图 12-1 的 每 个 C 块 中 的 逻辑 是 公式 (12-5) 的 逻辑 ， 如 图 12-3 所 示 。 


Pi 





Cii 
By 
图 12-2 (EAM ik $| (k+1) j 两 个 相 邻 子 范围 p 和 图 12-3 ”从 上 一 级 的 进位 信号 和 pg 
z 信和 号 的 函数 ， 递 归 地 生成 一 组 从 第 i 位 到 信号 生成 进位 信号 的 逻辑 


第 7 位 的 传递 信号 p; 和 生成 信号 g; 的 逻辑 


图 12-1 的 8 位 超前 进位 电路 的 Verilog 代码 以 及 从 加 法 器 的 输入 a 和 4 产生 p 和 g 的 逻辑 如 
图 12-4 所 示 。 该 代码 包括 直接 用 于 输入 、PG 块 和 C 块 的 公式 ， 而 不 是 为 每 个 块 类 型 定义 模 
块 ， 然 后 分 别 实 例 化 它们 中 的 每 一 个 。 在 这 种 情况 下 ， 用 公式 编写 代码 使 得 代码 更 容易 编写 和 
理解 。 

图 12-4 中 的 Verilog 代码 生成 了 许多 没 用 的 信号 。 例 如 ， 尽 管 只 需要 偶数 ， 但 还 是 给 所 有 
的 8 位 都 生成 了 在 代码 中 名 为 p2 [i] 的 成 对 的 传递 信号 pao 同样 ， 尽 管 只 使 用 第 0 位 和 
第 4 位 ， 但 还 是 为 全 部 的 8 位 都 生成 了 4 位 宽 的 传递 信号 p4 和 生成 信号 g4; 另外 尽管 只 使 用 
第 0 位 ,但 还 是 生成 了 8 位 宽 的 传递 信号 p8 和 生成 信号 g8 。 这 种 编码 风格 使 得 编写 公式 更 容 
易 ， 并 且 没 有 宛 余 ， 因 为 综合 工具 可 以 优化 掉 没 用 的 信号 并 且 只 生成 需要 的 一 些 逻 辑 。 

图 12-1 和 图 12-4 的 电路 使 用 的 扇 人 为 2。 也 就 是 说 ， 每 一 级 的 p 和 g 信号 成 对 地 组 合 来 形 
成 下 一 级 的 p 和 信号 。 根 据 现 有 技术 中 的 一 个 逻辑 级 的 最 佳 肩 入 和 扇 出 (参见 5.2 ~5.3 
节 ) ， 构 建 具有 较 大 扇 人 的 超前 进位 电路 可 能 会 更 快 。 例 如 ， 图 12-5 显示 了 一 个 扇 入 为 4 的 16 
位 超前 进位 电路 。 

图 12-5 的 电路 对 应 的 Verilog 代码 如 图 12-6 所 示 。 与 图 12-4 的 直接 实现 超前 公式 形成 对 
照 ， 该 模块 使 用 子 模块 (如 图 12-7 所 示 ) 进行 编码 ,来 实现 4 位 宽 的 PG 函数 和 进位 函数 。 对 
于 基数 为 4 的 情况 ， 这 样 使 得 代码 可 读 性 更 好 。 

当然 ， 超 前 进位 电路 的 扇 人 或 基数 不 能 是 2 的 矫 ， 可 以 构建 肩 出 为 3、5、6 或 者 任何 其 他 
值 的 超前 进位 电路 。 在 有 些 情 况 下 ， 采 用 混合 式 设计 能 够 获得 更 好 的 性 能 。 其 中 ,在 比较 靠 前 
的 级 中 (其 连 线 较 短 ) 使 用 较 大 的 扇 人 ， 在 相对 靠 后 的 级 中 使 用 较 小 的 鹿 信 〈 甚 连 线 较 长 , 
以 此 来 平衡 由 于 扇 和 造成 的 大 规模 电路 的 驱动 能 力 问 题 ， 即 较 长 的 连 线 具 有 的 逻辑 驱动 能 力 较 
小 (参见 第 5.3 节 ) 。 
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虽然 我 们 已 经 在 加 法 器 的 上 下 文中 举例 说 明了 超前 进位 ， 但 是 该 技术 可 以 应 apies 
维和 迭代 函数 。 例 如 ， 仲 裁 器 〈 见 第 8.5 节 ) 和 比较 器 〈 见 第 8.6 节 ) 可 以 根据 延迟 来 实现 ， 该 
延迟 随 着 所 使 用 的 超前 树 的 输入 数 呈 对 数 增 加 。 必 须 按 照 传 递 _ 生成 的 格 趟 写 出 该 迁 代 电路 的 
逻辑 : 


p = f, (a,b) (12-6) 
& = f,(a;,b;,°°°) (12-7) 

= By V (p; À a) (12-8) 
0; = fol Csa byat) (12-9) 


例如 ， 一 个 具有 从 LSB 到 MSB 的 进位 传递 的 数值 比较 器 在 传递 - 生成 中 可 以 按照 传递 — 生成 
格式 提出 : 


p. = (a, ®b;) (12-10) 
g= a, Ab, (12-11) 
o= cy (12-12) 


利用 这 个 公式 ， 我 们 可 以 使 用 图 12-5 的 电路 构建 一 个 只 有 4 ey 16 位 数值 比较 器 。 由 于 
数值 比较 器 仅 需要 进位 的 MSB 作为 其 输出 ， 因 此 图 12-5 中 的 Carry 块 可 以 省 略 。 

在 编写 Verilog 代码 时 ， 使 用 超前 进位 公式 来 描述 其 他 函数 比 用 该 公式 描述 加 法 器 更 重要 。 
现代 综合 工具 非常 擅长 采用 下 列 Verilog 代码 : 


assign s = a + b; 


并 将 其 扩展 为 高 度 优化 的 加 法 器 ， 包 括 超前 进位 〈 如 果 有 约束 的 话 ) Se LP A et th K 
数 进行 优化 ， 壁 如 优先 编码 器 和 比较 器 。 
我 们 将 会 在 习题 12.2 ~ 习题 12. 4 中 看 到 一 些 其 他 的 超前 进位 电路 的 应 用 实例 。 


// 8 位 超前 进位 
// 取 8 位 的 输入 a 和 b、ci 并 输出 co 
// 该 模块 生成 了 许多 没 用 的 信号 ， 其 会 被 综合 工具 优化 掉 
module Cla8(a, b, ci, co) ; 
input sn. a, Ü ç 
input ci ; 


output [8:0] co ; 
wire [7:0] p, g, p2, 92, p4, 94, p8, 98 ; // p 树 和 9g 树 


// PG 单元 的 输入 级 


assign p = a D ç 


assign g = a & b ; 


// 多 位 的 p 和 g 

// px [i] /gx lil 在 从 第 i 位 开始 的 xX 位 上 传递 /生成 

assign p2 p & {1’b0, p[7:1]} ; // 一 对 -只 使 用 0, 2, 4, 6 
assign g2 {1’b0, g[7:1)) | (g & {1’bO, p[7:1]}) 
assign p4 = p2 & [2'b00, p2[7:2]} ; // 半 字 节 一 只 使 用 0，4 





图 12-4 8 位 超前 进位 电路 的 Verilog 描述 。 该 代码 生成 了 许多 没 用 的 中 间 信 号 ， 通 过 综合 工具 优化 掉 


186 


REF J K eg 





assign g4 [2'b00, g2[7:2]} | (g2 & (2'b00, p2[7:2])) ; 
assign p8 = p4 & [4'b0000, p4[7:4]) ; // 一 字 节 一 只 使 用 0 


assign g8 {4’b0000, g4[7:4]} | (g4 & {4'b0000, p4[7:4] }) 


// 第 一 级 输出 ， 源 自 ci 
assign co[0] = ci ; 
assign co[8] g8[0] | (ci & p8[0]) ; 


assign co[4] g4[0] | (ci & p4[0]) ; 


assign co[2] g2[0] | (ci & p2[0]) ; 
assign co[1] g[0] | (ci & p[0]) ; 


// 第 二 级 输出 ， 源 自 第 一 级 

assign co [6] g2[4] | (co[4] & p2[4]) ; 
assign co[5] g[4] | (col4] & p[4]) ; 
assign co[3] gl2] | (col2] & pī) ; 


// 最 后 一 级 输出 ， 源 自 第 二 级 


assign co[7] = g[6] | (co[6] & p[6]) ; 
endmodule 
K 12-4 (2) 
p20 
pgl 
pg2 ° 


pe 


H? 


c8 


= 
cl? 


K: a 


° 
_ 
an 


图 12-5 HARRAH 4 的 16 位 超前 进位 电路 
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// 16 位 基 4 超 前 进位 

module Clal6é(a, b; ci, co) ; 
input [15:0] a, D + 
input ci ; 


output [16:0] co ; 


wire [15:0] p, g ; 
wire [3:0] p4, g4 ; // p4[i] 从 4 入 传递 到 4i+3 
wire pl6, g16 ; // 所 有 16 位 


// PG 单 元 的 输入 级 


assign p =a bi 3 


assign g = a & b ; 


// 输入 PG 级 

PG4 pg10(p[3:0], g[3:0], p4[0],g4[0]) 
PG4 pgl1(p[7:4], 917:4], p4[1],94[1]) 
PG4 pg12(p[11:8], g[11:8], p4[2],g4[2]) 
( 


PG4 pg13(p[15:12],g[15:12] , p4 [3] , g4 [3]) 


// 16 位 p 和 g 
PG4 pg2(p4, g4, p16, 916) ; 


// 进位 的 MSB 和 LSB 
assign co[16] = g16 | ci & pi6 ; 
assign co[0] = ci ; 


// 第 一 级 进位 
Carry4 cl0(ci,p4[2:0],g4[2:0],[co[12],co[8],co[4])) ; 


// 第 二 级 进位 

Carry4 c20(ci,p[2:0],g[2:0],co[3:1]) ; 

Carry4 c21(co[4],p[6:4],g[6:4],co[7:5]) ; 

Carry4 c22(co[8],p[10:8],g[10:8],co[11:9]) ; 

Carry4 c23(co[12],p[14:12],g[14:12],co[15:13]) ; 
endmodule 





图 12-6 图 12-5 的 16 位 基 4 超 前 进位 电路 单元 的 Verilog 描述 


// 4 位 PG 模块 

module PG4 (pi, gi, po, go) ; 
input [3:0] pi, gi ; 
output po, go ; 


assign po &pi ; 
assign go gil3] | (gi[2] & pi[3]) | (gill] & (&pif3:2])) | 


图 12-7 用 于 图 12-6 的 超前 进位 模块 的 4 位 PG 模块 和 4 位 Carry 模块 
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gi[0] & (&pi[3:1]) ; 
endmodule 


// 4 位 进位 模块 
module Carry4(ci, p, g, 


input ci ; 
input [2:0] p; g ; 
output [2:0] co ; 


wire [3:0] gg = {g, ci} ; 
assign co = (gg>>1) | (gg & p) | ((gg<<1) & p & (p<<1)) | 
((gg<<2) & p & (p<<1) & (p<<2)) ; 
endmodule 





图 12-7 ( 续 ) 


12.2 布 斯 编码 

在 10.4 节 中 描述 的 无 符号 二 进 制 乘法 器 产生 m 个 nn 位 的 部 分 积 ， 并 且 需 要 mx (n - 1) 4 
全 加 器 单元 将 这 些 部 分 积 求 和 为 最 终结 果 。 我 们 可 以 使 用 布 斯 编码 将 部 分 积 的 个 数 减 少 1⁄2 
(或 更 多 ) 。 男 外 一 个 好 处 是 ， 重 编码 更 容易 处 理 带 符号 数 的 2 的 补 码 输入 。 

基 2' 重 编 码 通过 将 n 位 乘法 器 改写 为 (ni) 位 的 基 2 的 数 来 运行 。 例 如 ， 可 以 将 6 位 二 
进 制 数 b=011011, 改写 为 3 位 〈 原 书 有 误 译 者 注 ) 四 进 制 〈 基 4) 数 123,。 将 该 数 乘 以 另 
一 个 二 进 制 数 a =010011, ， 仅 需 对 三 个 部 分 积 求 和 ， 如 岁 12-8 所 示 。 

这 种 简单 的 重 编码 要 求 从 移 位 后 的 最 高 可 达 a 的 2 -1 倍 中 选 
择 部 分 积 。 例 如 ， 对 于 上 面 讨论 的 基 4 乘 法， 要求 的 倍数 是 a、2a 
和 3a。2a 的 值 可 以 利用 一 个 简单 的 移 位 ,但 是 3a 需要 进行 一 个 
移 位 和 一 个 加 法 。 即 使 利用 这 种 加 法 先 去 计算 3a, 计算 乘 积 所 需 
的 全 加 器 的 总 数 也 减少 了 大 约 1⁄2 , 

布 斯 编码 不 需要 这 个 提前 做 的 加 法 (对 于 基数 4) ， 并 能 轻 而 
易 举 地 处 理 带 符号 数 的 2 的 补 码 。 它 是 通过 将 使 用 的 重生 的 数字 01000000001 
理解 为 带 符号 数 来 实现 的 。 每 一 个 数字 都 是 一 个 i+1 0604252. pg og 一 个 二 进 制 数 乘 以 











并 且 与 相 邻 数字 重 释 1 位 。 将 一 个 数字 的 位 视 为 一 个 位 向 量 bii, 四 进 制 数 的 实例 。 
bizs `, bos bio 每 个 数字 的 MSB 六 ,的 权重 为 (2), 每 个 与 6 位 二 进 制 数 x6 
数字 中 间 的 位 4 的 权重 为 2 ， 并 且 每 个 数字 的 LSB b ,的 权重 为 1 。 位 二 进 制 数 乘法 相 
按照 这 种 重 全 方式 ,该 加 权 方 式 确保 在 重 编 码 的 数 中 的 每 一 位 的 比 , 仅 有 3 个 二 进 
正确 的 总 权重 。 制 部 分 积 必须 求 和 


考虑 基 4 布 斯 编码 的 一 个 8 位 2 的 补 码 b，…，b。。 将 其 改写 为 4 个 数位 的 基 4 的 数 心 ，… 
d。， 其 中 第 i 个 数字 由 5,, 、b; 和 bb,,_13 位 组 成 ,它们 分别 用 -2、1 和 1 加权 (并 且 整 个 数字 
用 4 加 权 )。 对 重要 位 的 权重 求 和 可 得 到 2 的 补 码 的 正确 权重 。 例 如 ， 第 b, 位 是 数字 do 的 
MSB， 在 这 里 的 权重 为 -2， 并 且 它 是 数字 d, 的 LSB， 在 这 里 的 权重 为 4; 对 这 些 权重 值 求 和 ， 
则 得 到 的 总 权重 为 2， 即 第 5 位 的 正确 权重 。 表 12-1 说 明了 这 种 重 礁 方式 是 如 何 用 于 第 b, 位 
和 第 b; 位 的 。 横 线 下 面 每 一 位 的 权重 之 和 等 于 横 线 上 面 的 权重 。 为 了 使 数字 do 的 3 位 能 匹配 
地 操作 ， 假 设 b_ BAS. 
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表 12-1 8 位 二 进 制 数 基 4 布 斯 编码 的 权重 





位 b; bs b; ba bs b; b, bo b 
权重 -128 64 32 16 8 4 2 1 不 适用 
d, 一 128 64 64 

d, 82 16 16 

d -8 4 

do =2 l l 


如 表 12-2 所 示 ， 布 斯 编码 的 乘法 器 中 的 每 一 个 基 4 的 数字 d; 可 以 取 5 个 值 之 一 : -2、-1、 
0、1 或 2。 因 此 ， 采 用 布 斯 编码 的 每 一 个 数字 选择 这 5 个 被 乘 数 的 倍数 中 的 一 个 作为 该 数字 的 
部 分 积 ， 从 而 可 以 构建 一 个 产生 一 半数 量 的 部 分 积 的 乘法 器 。 所 有 这 些 被 乘 数 的 倍数 都 可 以 通 
过 简单 的 移 位 〈 乘 以 2) 和 逻辑 求 反 (执行 2 的 补 码 取 反 ) 来 实现 。 


表 12-2 基 4 数 字 d, 的 可 能 的 值 





boi 44 boi b; 1 4, bois ba; b; 1 4, 
0 0 0 0 1 0 0 -2 
0 0 1 1 1 0 1 -1 
0 1 0 1 l 1 0 -1 
0 1 I 2 l l 1 0 





图 12-9 给 出 一 个 采用 基 4 布 斯 编码 的 6 位 x4 位 2 的 补 码 乘法 器 。 该 设计 的 Verilog 实现 如 
图 12-10 和 图 12-11 所 示 。 

在 图 12-9 的 左 侧 ， 使 用 3 个 重 编码 器 (R) 块 将 输入 b. BJ 3 位 重 释 的 域 重 新 编码 为 3 个 
带 符号 的 四 进 制 数字 dy TERRE, E b, b, AO, (ARNO) 来 计算 最 低 有 效 的 数字 d。 
重新 编码 的 细节 如 图 12-11 所 示 。 将 每 一 个 重新 编码 的 数字 表示 为 一 个 3 位 的 域 ，MSB 来 编码 
这 个 数字 是 否 是 负 的 ， 最 低 两 位 来 编码 这 个 数字 是 2 还 是 1。 如果 这 个 数字 为 0， 则 所 有 的 3 
位 均 为 低 。 





图 12-9 采用 基 4 布 斯 编码 的 6 位 x4 位 2 的 补 码 乘 法 器 


每 一 个 R 块 的 输出 驱动 一 行 选择 (S) BR. H d 驱动 的 S$ 块 ， 通过 有 选择 的 移 位 〈( 如果 d, 
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为 上 2) APR (WR d, J - 1 sk -2) 完成 带 符号 的 a, Ad, "4 d = +1 时 , a 输入 必须 
符号 扩展 为 5 位 ， 给 出 具有 正确 符号 的 5 位 的 S 块 输出 。 取 反 位 d, MARTH S 块 的 输 
出 相 加 以 完成 乘法 ， 这 是 因为 2 的 补 码 取 反 要 将 一 个 数 求 反 然后 加 1。 

虽然 操作 数 a 仅 有 4 位 宽 ， 且 5 块 的 输出 仅 有 5 位 宽 , 但 用 来 完成 取 反 的 加 法 必须 是 6 位 
宽 以 便 处 理 所 有 的 情况 。 例 如 ， 考 虑 当 a = -8o =1000, H d, = -2 时， 所 得 到 的 部 分 积 pp: = 
+ 16 =010000 需要 6 位 。 这 两 个 6 位 的 输入 相 加 必须 进行 符号 扩展 才能 得 到 正确 的 结果 。 

对 于 加 法 器 的 每 一 行 ， 低 两 位 直接 用 作 输 出 ， 高 4 位 被 符号 扩展 到 6 位 ， 并 与 下 一 行 也 被 
符号 扩展 到 6 位 的 部 分 积 相 加 ， 最 终 输出 是 一 个 10 位 的 2 的 补 码 。 


// 6 位 X4 位 基 4 布 斯 编码 乘法 器 
module R4Mult64(a, b, s) ; 
input [3:0] a ; 
input [5:0] b ; 
output [9:0] s ; 


wire [2:0] d2, dl, dO ; // 重 编码 的 数字 ， 包 括 的 操作 有 : RK, ##2, ##1 


// 重 编码 器 

Recode4 r0({b[1:0],1’b0},d0) ; 
Recode4 r1(b[3:1],d1) ; 
Recode4 r2(b[5:3],d2) ; 


// 选择 器 ， 按 照 公 式 的 格式 ， 在 选择 1(d [0 ] ) 的 时 候 进行 符号 扩展 
wire [4:0] ppo = {5{do[2]}} ^ (({5{do[1]}} & (a, 1'b0}) 
| ({5{dofo]}} & {a[3], a})) ; 


wire [4:0] ppl {5{a1[2]}} ^ (({5{d1[1]}} & (a, 1’bo}) 
| ({s{azfol}} & {af3], a})) ; 

wire [4:0] pp2 = {5{d2[2]}} ^ (({5{d2[1]}} & (a, 1’b0}) 
| ({5{d2[o]}} & (a[3], a})) ; 


// 加 法 器 一 一 对 部 分 求 和 进行 符号 扩展 

// 半 加 器 的 第 一 行 

wire [5:0] psO {pp0[4],pp0} + do[2] ; . 

wire [5:0] ps1 {pp1[4],pp1} + {{3{pso[5]}},pso[4:2]} 
+ d1[2] ; // 加 法 器 的 第 二 行 

wire [5:0] ps2 {pp2[4] ,pp2} + {{3{ps1[5]}},ps1[4:2]} 
+ G2[2] ; // 加 法 器 的 第 三 行 

// 输出 

assign s = {ps2, ps1[1:0], ps0[1:0]} ; 





endmodule 
图 12-10 图 12-9 的 基 4 布 斯 编码 的 乘法 器 的 Verilog 代码 


虽然 我 们 的 实例 实现 了 基 4 重 编码 ， 它 可 以 用 2 的 任意 寡 为 基数 来 重新 编码 。 基 8 重 编码 
器 使 用 重合 的 4 位 的 域 (其 位 加 权 分 别 为 -4、2、1、1) 得 到 取 值 范围 从 -4 到 4 的 八进制 数 
字 ， 预 加 器 需要 产生 3a 作为 S 块 的 输入 之 一 。 

基 16 重 编码 器 使 用 重要 的 5 位 的 域 (其 加 权 为 -8、4、2、1、1) 来 得 到 取 值 范围 从 -8 





// 基 4 重 编码 块 


// 输出 求 反 、 选 择 2 和 选择 1 
module Recode4(b, d) ; 


input [2:0] Ð ; 


output [2:0] 


reg [2:0] d ; 


always @(*) 
case (b) 
B, T 
pas 


1 
3 
` 4: 
5,6: da 


q i 


begin 


‘booo ; 
"bool ; 
“BOLO ; 
110 ; 
“b101 ; 


3 
3 
3 
3! 
3 
d 


default: 
endcase 


end 


endmodule 
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// 不 选择 ， 不 求 反 
// 选择 1 

// 选择 2 

// 选择 2， 求 反 
// 选择 1， 求 反 


= 3'b000 ; // 不 应 被 选择 


图 12-11 图 12-10 的 布 斯 编码 乘法 器 的 重 编码 块 


到 8 的 十 六 进 制 数字 ， 预 加 器 需要 产生 3a, 5a 和 
Ta 等 数值 ，6a 是 S 块 将 30 进行 移 位 而 得 到 的 。 
基 32 甚至 基 64 重 编码 器 也 适用 这 种 方法 ， 并 
且 可 能 对 超大 型 的 乘法 器 有 兴趣 。 


12.3 华 莱 士 树 


图 10-15 的 简单 无 符号 乘法 器 和 图 12-9 的 重 
编码 乘法 器 都 是 成 直线 地 经 过 一 系列 与 输入 的 个 
数 成 正比 的 加 法 器 来 传递 进位 信号 。 对 于 简单 的 
n fii xm 位 的 乘法 器 ， 进 位 链 的 长 度 是 n+m -2。 
XIF n A xm 位 的 基 4 布 斯 编码 乘法 器 ， 进 位 链 
的 长 度 是 n+m/2 +1。 通 过 将 加 法 器 组 织 成 一 个 
树 形 结 构 而 不 是 一 个 线性 阵列 ， 从 而 将 每 个 权重 
对 应 的 部 分 积 减 少 到 最 多 两 个 ， 进 而 可 以 将 累加 
部 分 积 中 的 延迟 0(n) 减 小 到 0(log(n))。 然 后 
可 以 使 用 超前 进位 加 法 器 ( 见 第 12.1 节 ) 进行 
最 终 求 和 。 

对 于 图 10-15 的 4 位 乘 4 位 的 乘法 器 ， 图 12-12 
给 出 了 累加 部 分 积 (标记 为 pp;) 的 电路 ， 图 左 
侧 的 部 分 积 是 图 10-15 中 与 门 的 输出 信号 pp, = 
a, Ab, IMS 个 全 加 器 (FA) 和 一 个 半 
加 法 器 组 成 ， 将 每 个 权重 对 应 的 部 分 积 减 少 到 


PP oo 





Po 


P; 


超前 进位 加 法 器 


P, 


Ps 


Ps 
P: 


最 多 两 个 。 然 后 超前 进位 加 法 器 形成 的 最 终 乘 图 12-12 华 莱 填 树 ， 用 于 累加 图 10-15 中 简单 的 
4 位 乘 以 4 位 的 无 符号 乘法 器 的 部 分 积 


积 的 延迟 与 字 长 呈 对 数 关系 。 


[264 | 


265 





192 PAGD FR Gë £ 








图 中 部 分 积 在 垂直 方向 按 权 重 分 组 ， 用 虚线 分 开 每 一 组 。 权 重 1 和 2 的 第 0 组 和 第 1 组 有 
2 个 或 更 少 的 部 分 积 ， 因 此 不 需要 减少 。 这 些 部 分 积 可 以 直接 输入 到 超前 进位 加 法 右 。 

权重 4 的 第 2 组 有 3 个 二 进 制 数 部 分 积 (ppos、pput 和 ppxo)， 将 其 输入 一 个 全 加 右 ， 产 生 一 
个 权重 4 的 信号 wla? (将 该 信号 输入 到 超前 进位 加 法 器 ) 以 及 一 个 权重 8 的 信号 wla3 (将 该 
信号 传递 到 下 一 组 )。 

中 间 信 号 的 名 称 指明 了 信号 的 级 、 信 号 权重 的 对 数 ， 并 且 其 能 识别 这 个 级 和 权重 的 独 有 的 信 
号 。 例 如 ,wla3 在 第 1 级 ,权重 8， 即 2 ,并 且 是 具有 这 两 个 属性 的 第 一 个 信号 (因此 标记 是 a) 。 

权重 8 的 第 3 组 有 4 个 部 分 积 ， 其 中 3 个 输入 一 个 全 加 器 中 ， 第 4 个 传递 到 第 2 级 的 第 2 
个 全 加 器 。 第 二 个 全 加 器 将 两 个 第 3 组 第 1 级 的 信号 wla3 和 wl153 以 及 第 3 组 剩 下 的 输入 ppso 
合 在 一 起 ， 产 生 一 个 第 3 组 第 2 级 的 信号 w2a3， 并 和 一 个 第 4 组 第 2 级 的 信号 w2a4 一 同 输入 
超前 进位 加 法 器 。 

在 剩 下 的 组 中 继续 这 个 过 程 。 每 个 组 中 的 部 分 积 和 中 间 信 和 号 通过 全 加 顺和 一 个 半 加 器 来 削 
减 ， 直 到 每 一 组 中 的 信号 数 为 2 个 或 更 少 ， 此 时 将 它们 输入 到 最 后 的 超前 进位 加 法 器 。 

利用 全 加 器 和 半 加 器 ， 每 一 级 的 加 法 器 都 削减 了 部 分 积 ， 如 表 12-3 所 示 。 该 表 给 出 了 对 
应 每 个 权重 为 i 的 输入 数 ， 经 由 一 级 全 加 器 和 半 加 器 将 产生 多 少 个 权重 i 和 2i 的 输出 。 例 如 ， 
对 于 权重 i 的 6 个 输入 ,使 用 两 个 全 加 器 可 以 为 权重 i 和 2i 中 的 每 一 个 各 生成 两 个 输出 。 在 某 
些 情况 下 ， 可 以 选择 是 否 削 减 这些 输 出 。 例 如 ， 对 于 给 定 权重 的 两 个 部 分 积 ， 可 以 用 直通 的 方 
式 传 递 这 些 输入 ， 或 许 像 图 12-12 中 的 第 1 组 那样 输入 超前 进位 加 法 器 ， 或 者 可 以 将 它们 输入 
半 加 法 器 ， 来 为 权重 i 和 2i 中 的 每 一 个 各 生成 一 个 输出 。 在 表 的 最 后 两 列 中 给 出 的 这 种 削减 蔡 
代 的 方案 是 有 意义 。 


表 12-3 在 华 莱 士 树 的 1 级 中 部 分 积 削减 的 数量 

















利用 表 12-3 的 削减 数 ， 表 12-4 给 出 了 如 何在 4 级 的 全 加 器 和 半 加 器 中 削减 8 位 乘 以 8 位 
的 简单 无 符号 乘法 器 的 部 分 积 。 第 一 行 显示 的 是 组 号 ， 即 权重 的 log,。 第 二 行 显示 的 是 每 组 中 
的 部 分 积 的 个 数 〈pps) : 需要 求 和 的 给 定 权重 的 位 数 。 余 下 的 行 显 示 的 是 在 每 一 级 全 加 器 之 后 
每 一 个 权重 剩 下 的 信和 号 数 ， 使 用 表 12-3 的 削减 规则 计算 这 个 数量 。 每 一 个 数 仅 取决 于 它 上 面 
的 数 和 右上 方 的 那个 数 。 例 如 ， 第 9 组 在 第 1 级 之 后 有 4 个 信号 ， 这 包括 从 第 9 组 中 的 6 个 部 
分 积 削减 的 两 个 信号 和 两 个 附加 信号 〈 第 8 组 中 7 个 部 分 积 削减 的 进位 输出 ) 。 
表 12-4 对 于 一 个 8 位 乘 以 8 位 的 简单 无 符号 乘法 器 ， 华 莱 士 树 累加 的 部 分 积 。 在 “pps” 这 
行 中 给 出 每 个 权重 对 应 的 部 分 积 的 个 数 ， 在 随后 的 每 行 中 给 出 了 每 级 全 加 器 之 后 该 





权重 所 剩余 的 信号 数 
log, 权重 “4 (3 @ A #0 S 8 7 E 5 4 8 2 i Ø 
pps 1 2 3 4 5 6 7 § * & % 4 5 j 
第 1 级 l 3 2 4 4 á 6 5 5 4 3 3 1 
第 2 级 2 1 名 3 3 4 4 4 3 3 Ë 1 
第 3 级 站 
第 4 级 2 9 2⁄2 A | 


在 第 12 组 的 第 2 级 ， 可 以 选择 是 否 将 两 个 第 1 级 的 信号 传递 到 第 3 级 ， 或 者 用 半 加 器 将 一 
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个 信号 直接 传送 到 第 13 组 。 通 过 传递 这 些 信号 ， 能 够 在 第 3 级 中 使 用 全 加 器 将 三 个 信号 减少 
到 两 个 ， 即 第 12 组 和 第 13 组 各 一 个 。 这 种 避免 使 用 半 加 器 的 策略 允许 累积 足够 的 信号 来 使 用 
全 加 器 ， 这 将 减少 下 一 级 中 信号 的 总 数 。 

表 12-5 给 出 了 布 斯 编码 如 何 削减 部 分 积 的 个 数 ， 从 而 削减 它们 所 需要 的 级 数 。 由 于 采用 
了 布 斯 编码 来 做 带 符号 的 乘法 ， 因 此 必须 将 所 有 部 分 积 的 符号 扩展 到 整个 位 宽 ， 还 必须 考虑 华 
莱 士 树 中 每 个 输入 位 〈 第 0、2、4 和 6 位 ) 的 进位 。 采 用 重新 编码 可 以 在 超前 进位 加 法 器 之 前 
仅 需 用 3 级 加 法 器 来 实现 16 位 乘法 器 。 而 没有 采用 重新 编码 则 需要 4 级 。 


表 12-5 对 于 一 个 8 位 乘 以 8 位 的 简单 无 符号 基 4 布 斯 编码 乘法 器 ， 华 莱 士 树 累加 的 部 分 积 。 
因为 符号 扩展 了 所 有 的 部 分 积 ， 第 10 ~ 15 位 每 个 都 有 4 个 输入 





log, 权重 15 14 13 12 1 10 9 8 7 6 5 4 3 2 1 0 
pps ¿4 A k 4 4 4 á 4 5 3 4 2 3 1 2 
第 1 级 3 1 

第 2 级 J a 3 2 a 2 2 © F Z 2 1 

第 3 级 ¿2 8 2 2 3 3. 2 2 1 


除了 在 乘法 器 中 对 部 分 积 求 和 之 外 ， 还 可 以 用 全 加 器 树 对 N 4 b 位 数 的 O(log (NV) log ( b) ) FFF 
求 和 。 例 如 ,图 12-13 展示 了 如 何 用 3 级 全 加 器 树 来 对 6 个 数 进行 求 和 ， 该 电路 的 Verilog 代码 
如 图 12-14 所 示 。 
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module MultiAdder FA Tree(in0, inl, in2, in3, in4, ins, 
out) ; 
// 硬 编码 4 位 输入 


input [3:0] ino, inl, in2, in3, in4, ins; 


// 当 对 6 个 数 求 和 时 ， 在 输出 中 需要 3 位 附加 位 


output [6:0] out; 


// 需要 符号 扩展 输入 


wire [6:0] se_in0, se_ini, ge in2, se_in3, se in4, 


wire [6:0] s00, s01, s10, s20; // s( 级 )( 单 元 ) 
wire [6:0] c00, c01, c10, c20; // c( 级 )( 单 元 ) 
wire [3:0] toss; 


// 不 需要 第 7 位 ， 丢弃 这 位 的 输出 


// 符号 扩展 输入 

assign se in0 {in0[3], inO[3], ino[3], 
assign se inl f 206323], dallay; 
assign se_in2 {in2[3], in2[3], in2[3], 
assign se_in3 {in3[3], in3[3], in3[3], 
assign se_in4 {in4[3], in4[3], in4[3], 
assign se_in5 {in5[3], in5[3], in5[3], 


// 将 低位 进位 输入 设置 为 0 
assign c00[0] = 0; assign c01[0] 0; 
assign c10[0] = 0; assign c20[0] 0; 


fa fa0l_0(se_inO[0], se_ini[0], se_in2[0], s00[0], c00[1]); 
fa fa02_0(se_in3[0], se in4[0], se_in5[0], s01[0], c01[1]); 
fa fal0_0(s00[0], c00[0], cO1[0], s10[0], c10[1]); 
fa fa20_0(s01[0], s10[0], c10[0], s20[0], ¢20[1]); 


// 第 1、2、3、4、5 位 的 加 法 器 阵列 减少 代码 长 度 

fa £a00_51[5:1] (se_inO[5:1], se_ini[5:1], se_in2[5: 
s00[5:1], c00[6:2]); 

fa fa01_51[5:1] (se_in3 [5:1], se in4[5:1], se_in5[5: 
s01[5:1], c01[6:2]); 

fa fa10_51[5:1] (s00[5:1], c00O[5:1], c01[5:1], 
s10[5:1], c10[6:2]); 

fa fa20_51[5:1] (s01[5:1], s10[5:1], c10[5:1], 
s20[5:1], c20[6:2]); 


fa fa0l1 6(se in0[6], se inl[6], se_in2[6], s00[6], toss[0]); 
fa fa02_6(se_in3[6], se in4[6], se_in5[6], s01[0], toss[1]); 
fa fal0_6(so0[6], c00[6], cO1[6], s10[6], toss[2]); 
fa fa20_6(s01[6], s10[6], c10[6], s20[6], toss[3]); 


assign out = s20 + c20; 





endmodule // MultiAdder FA Tree 


图 12-14 用 于 6 输入 带 符号 加 法 器 的 Verilog 模块 ， 由 1 位 全 加 器 电路 (fa) 构成 
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因为 每 级 加 法 器 将 给 定 权 重 的 信号 数 削减 2/3 ， 所 以 只 用 两 个 加 法 器 的 输入 对 N 个 数 求 和 
所 需 的 级 数 S 被 限制 为 : 

S => [loga (NN | (12-13) 
遗憾 的 是 ， 这 个 限制 并 不 是 很 严谨 。 例 如 ， 它 表明 可 以 在 4 个 级 中 对 10 个 输入 求 和 ， 而 实际 
上 需要 5 级 。 严 谨 的 限制 可 以 通过 循环 的 方式 来 达到 : 

S(N)=0 # O<NSs2 (12-14) 


s~) =1+5 (w-|*]) # N33 (12-15) 
具有 权重 相等 的 N 4-8 A SERE a =| 3 | 个 全 加 器 将 输入 减少 到 N — a 个 信号 ， 直 


到 输出 仅 有 两 个 信号 。 在 表 12-6 中 列举 了 的 S (N) 的 前 16 个 值 。 
表 12-6 使 用 全 加 器 的 华 莱 士 树 将 人 个 输入 减少 到 两 个 输出 所 需 的 级 数 


上 mb 一 | 之 
s — ° ° 





= 
S O O UH 


在 本 节 中 ， 我 们 着 眼 于 使 用 全 加 器 对 权重 相等 的 位 进行 压缩 ， 将 3 个 权重 相等 的 位 压缩 为 
一 个 2 位 的 二 进 制 数 ， 其 表明 了 在 这 3 位 输入 中 1 的 个 数 。 因 此 ， 在 上 下 文中 使 用 的 全 加 器 有 
时 被 称 为 3-2 压缩 器 或 3-2 计数器。 可 以 用 更 高 的 基数 的 压缩 器 构建 削减 树 。 例 如 ， 可 以 设 
计 一 个 接受 7 位 权重 相等 的 输入 并 输出 一 个 3 位 二 进 制 数 的 7 -3 压缩 器 ， 它 计 取 输入 中 1 的 
个 数 。 习 题 12. 12 将 探讨 利用 这 个 7 -3 压缩 器 构建 华 莱 土 树 。 同 样 还 可 以 将 两 个 全 加 器 组 合 
在 一 起 (以 进位 输入 和 进位 输出 为 模 ) 得 到 一 个 4-2 压缩 器 。 这 个 概念 将 在 习题 12. 13 中 进 
行 探 讨 。 


12.4 综合 说 明 


虽然 有 时 候 需要 明确 地 对 乘法 器 和 加 法 器 进行 编码 以 实现 特定 的 目标 ， 但 在 大 多 数 情况 
下 ， 现 代 综 合 工具 都 足以 胜任 ， 任 何 一 种 工具 只 需 分 别 使 用 Verilog 运算 符 * 和 + ， 就 能 很 容 
易 地 生成 高 效 的 带 符号 和 无 符号 的 乘法 器 和 加 法 器 。 综 合 工具 都 有 一 个 大 规模 的 加 法 器 和 乘法 
器 设计 库 ， 并 将 选择 满足 特定 时 序 约束 的 、 成 本 最 低 的 设计 。 


小 结 


在 本 章 中 ,你 已 经 学 习 了 如 何 设计 快速 算术 电路 。 已 经 涵盖 了 在 当今 几乎 所 有 高 性 能 算术 
电路 中 使 用 的 三 种 技术 : 超前 进位 、 布 斯 编码 和 华 莱 士 树 。 

通过 用 一 个 树 形 逻 辑 模 块 计算 一 组 位 的 进位 输出 ， 可 以 执行 一 个 在 延迟) 时间 上 与 log, (n) 
而 不 是 nn 成 比例 的 n 位 加 法 。 为 了 构建 超前 进位 树 ， 不 管 带 入 的 进位 是 什么 ,依据 特 定 的 函数 
p 和 gg 来 用 公式 表示 加 法 运算 (或 其 他 迭代 函数 )， 特 定 的 函数 p 和 gg 通过 1 位 传递 进位 并 生成 
1 位 的 进位 输出 。 由 更 少 位 的 一 组 (最 后 是 1 位 ) AY p Al z 函数 递归 地 计算 一 组 位 的 PP 和 8& K 
数 。 一 旦 计算 出 一 组 位 的 进位 输出 ， 可 以 用 反 向 树 来 计算 该 组 中 每 一 位 的 进位 输出 。 

我 们 可 以 采用 布 斯 编码 乘法 器 的 一 个 输入 ,将 需要 在 乘法 器 中 求 和 的 部 分 积 的 个 数 削减 
1/2 (或 更 多 )。 例 如 ， 按 照 基 4 布 斯 编码 ,将 n 位 输入 重新 编码 为 (n/2) 位 的 基 4 的 数 ， 其 
中 每 位 数字 的 取 值 是 在 -2 和 2 之 间 的 整数 。 与 门 通过 可 选 的 移 位 (用 于 2 和 -2) 和 取 反 
(用 于 -2 和 -1) 来 计算 每 一 个 符号 扩展 后 的 部 分 积 。 然 后 ， 对 所 得 到 的 、 小 得 多 的 一 组 部 分 
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积 求 和 。 另 外 一 个 好 处 是 ， 布 斯 编码 处 理 2 的 补 码 只 需 很 少 的 额外 代价 。 

我 们 可 以 使 用 加 法 器 树 来 对 乘法 器 的 部 分 积 求 和 (无论 是 否 使 用 重新 编码 ) 。 华 菜 士 树 对 
部 分 积 求 和 的 时 间 与 对 N 个 部 分 积 求 和 的 时 间 的 log (N/2) 成 正比 。 

虽然 理解 这 些 用 于 构建 快速 算术 电路 的 技术 固然 很 重要 ， 但 是 现代 综合 工具 已 将 这 些 技术 
以 及 其 他 一 些 技术 吸收 到 了 优化 的 算术 运算 单元 设计 库 中 。 因 此 ， 在 实现 标准 算术 运算 功能 
时 ， 不 必 再 用 手动 的 方法 来 实例 化 这 些 功 能 ， 综 合 工具 能 很 好 地 处 理 这 些 情况 。 在 实现 其 他 功 
能 时 ， 有 必要 用 手动 的 方法 实现 ,例如 ， 可 以 由 超前 进位 提高 效率 的 其 他 的 迭代 电路 。 


文献 说 明 


MacSorley [72] 在 1961 年 发 表 的 经 典 论文 中 包括 了 本 章 所 描述 的 所 有 技术 ,以 及 一 些 其 
他 的 技术 。 该 文 展示 了 20 世纪 60 年 代 初 期 计算 机 算法 领域 的 成 熟 度 。1956 年 ，Weinberger 和 
Smith 第 一 次 阐述 了 超前 进位 [107] 。 关 于 快速 加 法 器 的 更 多 信息 ， 请 参阅 Harris 的 并 行 前 级 
加 法 器 分 类 法 [45] 或 Ling 关于 快速 加 法 的 论文 [67]. 

重新 编码 源 自 布 斯 算法 [14] ， 最 初 开 发 它 主要 用 于 软件 中 顺序 执行 乘法 。 在 本 书 中 描述 
的 并 行 格式 与 MacSorley 描述 的 并 行 格式 [72] 类 似 。 参 考 文献 [106] 第 一 次 阐述 了 华 莱 
+H. 

感 兴趣 的 读者 可 参考 很 多 的 教材 和 专题 文章 之 一 ， 包 括 参 考 文献 [24]. [41]. [42] 和 
[52]. 

之 前 的 3 章 只 涉及 了 有 趣 的 计算 机 算法 的 一 些 肤浅 话题 。 感 兴趣 的 读者 还 可 以 参考 很 多 相 
关 的 优秀 教材 及 专著 ， 包 括 参 考 文献 [24]. [41]. [42] 和 [52]. 


习题 

12.1 超前 混合 基数 。 编 写 一 个 32 位 数值 比较 器 的 Verilog 代码 ,使 用 扇 人 为 5 或 6 的 PG 块 的 超前 
进位 。 

12.2 反 向 进位 传递 。 编 写 一 个 32 位 数值 比较 器 的 Verilog 代码 ， 进 位 从 MSB 传递 到 LSB， 并 使 用 了 扇 
入 为 4 的 超前 进位 (提示 : 参见 图 8-40b) 。 

12.3 超前 仲裁 。 编 写 一 个 32 位 仲裁 器 的 Verilog 代码 ， 使 用 了 扇 和 人 为 4 的 超前 进位 。 

12.4 超前 优先 编码 器 。 结 合 超前 进位 与 图 8-24 中 所 示 的 技术 来 构建 一 个 32 位 优先 编码 器 ， 使 用 的 扇 
人 为 4。 

12.5 无 符号 重 编码 乘法 器 。 重 新 设计 图 12-9 和 图 12-10 中 的 基 4 布 斯 编码 乘法 器 ， 用 来 处 理 无 符号 数 。 

12.6 基 8 布 斯 编码 器 。 设 计 一 个 基 8 布 斯 编码 器 。 先 写 出 与 表 12-1 MK 12-2 类 似 的 一 个 表 ， 编 写 用 于 
6 位 与 6 位 相 乘 的 Verilog 代码 ， 只 生成 两 个 部 分 积 。 

12.7 基 16 布 斯 编码 器 。 重 复习 题 12.6， 但 是 换 成 使 用 基 16 布 斯 编码 的 8 位 与 8 位 相 乘 。 

12.8 优化 布 斯 编码 。 对 于 64 位 带 符号 乘法 ， 请 你 确定 重 编码 的 基数 ， 要 求 使 用 最 少 的 全 加 器 ， 包 括 用 
于 先 计算 乘 数 a 的 加 法 器 和 用 于 求 和 部 分 积 的 加 法 器 。 

12.9 优化 布 斯 编码 。 针 对 128 位 带 符号 乘法 ， 重 复习 题 12.8. 

12.10 需要 所 有 的 加 法 器 吗 ? 在 图 12-9 的 每 一 行 中 最 左边 的 两 个 加 法 器 的 输入 信号 完全 相同 。 因 此 ， 
人 们 或 许 会 认为 最 左边 的 加 法 器 可 以 不 要 了 ， 然 后 将 其 输出 连 至 同一 行 中 的 倒数 第 二 个 加 法 器 的 
进位 输出 。 这 种 说 法 正确 吗 ? 如果 正 确 ， 解 释 为 什么 ; 如 果 不 正确 ,解释 为 什么 不 正确 ， 并 提出 
一 种 替代 方法 来 简化 这 个 逻辑 (提示 : 考虑 确保 a = -8 Alb =2, 8 或 12 的 情况 ) 。 

12.11 16 位 xl16 位 基 4 布 斯 乘法 器 的 华 菜 士 树 。 绘 制 一 个 与 表 12-4 MR 12-5 类 似 的 表格 ， 华 莱 士 树 对 
16 位 x 16 位 基 4 布 斯 编码 乘法 器 的 部 分 积 求 和 。 记 住 要 符号 扩展 部 分 积 。 

12.12 7 输入 计数 器 单元 的 华 菜 士 桂 。 假 设 有 一 个 全 加 法 器 ， 其 有 3 个 权重 i 的 输入 并 生成 1 个 权重 i 的 
输出 和 1 个 权重 2i 的 输出 。 此 外 ， 还 有 一 个 7 输入 的 “ 双 加 器 " ， 其 有 7 个 权重 i 的 输入 并 为 每 


12. 13 


12. 14 


12. 15 


12. 17 


12. 18 
12. 19 


12. 20 


#£#1232 KeEFKEB 197 








一 个 权重 i、2i #l4i 分 别 生成 1 个 输出 。 针 对 使 用 这 些 7 输入 单元 (以 及 全 加 器 和 半 加 法 器 ) 的 
16 位 x 16 位 基 4 布 斯 编码 的 乘法 器 ， 绘 制 与 表 12-4 和 表 12-5 类 似 的 表 。 

4 一 2 压缩 器 。 图 12-15 给 出 了 一 个 4-2 压缩 
器 ， 它 使 用 4 位 输入 ， 并 通过 所 使 用 的 两 个 
加 法 器 产生 2 位 输出 。 

(a) 使 用 这 些 “ 四 ”输入 单元 为 16 位 x 16 
位 基 8 布 斯 编码 的 乘法 器 绘制 一 个 与 表 
12-4 和 表 12-5 类 似 的 表 。 可 以 假设 能 
提供 先 做 加 法 的 部 分 积 。 

使 用 4 -2 压缩 器 将 n 个 部 分 积 前 减 到 2 
个 的 延迟 的 边界 是 什么 ”根据 一 个 全 加 
器 的 延迟 写 出 答案 。 这 比 使 用 一 个 基本 
的 3 -2 华 莱 士 树 更 快 还 是 更 慢 ? 

对 于 相同 的 输入 数 ， 为 了 让 4 -2 华 莱 
土 树 与 3 -2 华 莱 士 树 的 延迟 相等 ,一 
个 4-2 压缩 器 的 延迟 必须 为 多 少 ? 


(b 


— 


(c 


w 





华 菜 土 树 选择 。 重 新 绘制 表 12-5， 但 在 第 12 图 12-15 一 个 4-2 压 缩 器 由 两 个 全 加 法 器 组 成 。 
组 的 第 1 级 中 使 用 一 个 半 加 法 器 ， 而 不 是 将 a) 采取 4 位 输入 并 产生 1 个 进位 及 1 
第 12 组 的 2 个 部 分 积 传递 到 第 2 级 。 个 和 。 如 b) 所 示 ， 将 中 间 的 进位 从 一 
每 个 部 分 积 有 2 位 的 华 菜 土 树 。 为 华 菜 士 树 位 传递 到 下 一 位 。 在 习题 12. 13 中 使 用 
绘制 一 个 与 表 12-4 和 表 12-5 类 似 的 表 ,， 来 这 种 结构 


对 15 位 基 8 布 斯 编码 乘法 器 的 部 分 积 求 和 。 假 设 每 个 部 分 积 由 2 位 组 成 ， 以 允许 在 不 先 做 相 加 
的 情况 下 处 理 3a 情况 。 

简化 华 菜 士 树 。 图 12-12 中 的 两 个 全 加 器 可 以 用 半 加 器 代替 。 根 据 这 个 变化 重新 绘制 该 图 ， 给 出 
如 何 处 理 现在 每 个 加 法 器 多 出 来 的 输入 。 这 个 具有 三 个 半 加 器 和 三 个 全 加 器 的 设计 是 否 比 最 初 的 
设计 好 ? 解释 为 什么 是 或 为 什么 不 是 。 

快速 乘法 运算 ， 设 计 。 设 计 一 个 延迟 最 小 的 32 位 x32 位 2 的 补 码 乘法 器 。 你 的 设计 应 包括 部 分 
积 的 布 斯 编码 (具有 最 佳 的 基数 ) ， 一 个 用 于 削减 部 分 积 的 华 莱 士 树 ， 以 及 一 个 用 于 执行 最 终 求 
和 的 超前 进位 加 法 器 (具有 最 佳 的 基数 )。 注 意 正确 处 理 求 和 树 中 的 符号 扩展 。 给 出 该 设计 完整 
的 延迟 分 析 。 

快速 乘法 运算 ， 实 现 。 编 写 习题 12.17 的 乘法 器 的 Verilog 代码 ， 并 使 用 测试 平台 验证 它 。 
快速 无 符号 乘法 运算 ， 设 计 。 设 计 一 个 延迟 最 小 的 32 位 x32 位 无 符号 乘法 器 。 你 的 设计 应 包括 
部 分 积 的 布 斯 编码 (具有 最 佳 的 基数 ) ， 一 个 用 于 削减 部 分 积 的 华 莱 士 树 ， 以 及 一 个 用 于 执行 最 
终 求 和 的 超前 进位 加 法 器 (具有 最 佳 的 基数 ) 。 给 出 该 设计 完整 的 延迟 分 析 。 

快速 无 符号 乘法 运算 ， 实现。 编写 习题 12. 19 的 乘法 器 的 Verilog 代码 ， 并 使 用 测试 平台 验证 它 。 
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本 章 给 出 了 几 个 算术 运算 电路 的 设计 与 实现 ， 它 们 都 使 用 了 第 10 ~ 12 章 中 介绍 的 技术 。 首 
先 ， 给 出 一 个 定点 复数 乘法 器 的 设计 。 然 后 ， 介 绍 一 种 8 位 浮 点 数 格式 ， 并 开发 这 种 格式 与 定点 
数 格式 之 间 相 互 转换 的 电路 单元 。 最 后 ， 以 有 限 脉 冲 响应 (FIR) 滤波 器 的 实现 作为 结尾 。 


13. 1 复数 乘法 
两 个 复数 a + ib Ail c + id 相 乘 得 到 : 
(a + ib) x (c + id) = (ac — bd) + i(be + da) (13-1) 
为 了 得 到 乘积 的 实 部 和 虚 部 ， 需 要 4 个 乘法 器 和 2 ME ES HF? = -1， 所 以 必须 从 实数 


输入 分 量 的 乘积 中 减 去 两 个 虚数 输入 分 量 的 乘积 ， 得 出 输出 的 实 部 。 

复数 乘法 器 采用 信号 处 理 中 常用 的 s1. 14 定点 格式 〈 见 11.2 节 )。 一 直到 最 终 的 求 和 ， 为 
了 避免 触发 溢出 错误 或 丢失 精度 ， 要 保持 中 间 值 在 全 位 宽 。 两 个 1. 14 格式 的 数 相 乘 得 到 一 个 
52. 28 格式 的 乘积 ， 然 后 再 将 这 两 个 乘积 相 加 得 到 一 个 s3. 28 格式 的 结果 。 在 模块 的 最 后 一 级 
检查 溢出 ， 并 将 83. 28 格式 的 结果 舍 人 为 一 个 s1. 14 格式 的 数 。 当 s3. 28 格式 的 结果 的 3 个 最 高 
有 效 位 不 是 同一 值 时 ， 则 发 生 溢 出。 前 导 1 表示 负 洲 出， 前 导 0 表示 正 溢出 。 复 数 乘法 器 采用 
饱和 算术 运算 ， 将 结果 固定 在 某 个 溢出 上 以 最 小 化 误差 (见习 题 10.20). 

复数 乘法 器 实现 的 框图 和 Verilog 代码 分 别 如 图 13-1 和 图 13-2 所 示 。Verilog 模块 使 用 了 关 
F signeaQ， 当 运算 中 使 用 该 关键 字 时 ， 将 自动 地 符号 扩展 输入 。 


a_real s1,14 
舍 人 有 | 5114 x_real 
饱和 
' SAG sl14 x_img 
饱和 


13-1 一 个 sl. 14 格式 的 定点 复数 乘法 器 。 该 电路 由 两 个 16 位 乘法 器 和 两 个 31 位 加 
法 器 组 成 ， 该 电路 需要 两 个 复数 输入 a 和 8， 并 产生 复数 输出 x 
图 13-1 的 设计 很 简单 ， 因 为 乘法 器 和 加 法 器 都 不 是 专用 电路 单元 ， 它 也 不 是 最 快 的 。 每 
个 乘法 器 都 有 自己 的 部 分 积 生 成 电路 和 削减 树 ， 通 过 31 位 加 法 器 得 到 一 个 结果 (DL 12.3 节 ) 。 
为 了 消除 这 个 加 法 器 的 延迟 ， 可 以 修改 乘法 器 来 省 掉 最 后 一 级 加 法 ， 并 且 改 为 输出 削减 后 的 部 
分 积 。 可 以 使 用 两 个 全 加 器 电路 来 将 这 4 个 值 削减 到 最 后 一 级 加 法 的 两 个 输入 。 输 出 的 实 部 需 
要 一 个 减法 操作 ， 它 通过 将 b_img 输入 到 修改 后 的 乘法 器 之 前 将 b_img 反 相 来 执行 (从 图 13-3 
看 应 该 是 b_img 一 一 译 者 注 ) 。 在 图 13-3 中 给 出 了 修改 后 的 框图 ， 但 把 中 间 连 线 的 位 宽 以 及 最 











a_img s1,14 










b_real s1,14 






b_img si.14 


© 也 可 以 用 三 个 乘法 器 (ad, bc, (a-b) (c+d)) 构建 该 电路 ， 但 我 们 重点 关注 具有 4 个 乘积 的 实现 。 
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终 的 设计 留 给 读者 在 习题 13. 1 中 完成 。 


module complex mult(a real, a img, b real, b img, x real, x img); 


input signed [15:0] a real, a_img, b_real, b_img; //sl.14 格 式 


output signed [15:0] x real, x img; //sl.14 格 式 


wire 
wire 


wire 


Tf s2- 


wire 
wire 
wire 


wire 


// s3 
wire 


wire 


281 Á 

signed 
signed 
signed 


signed 


.28 格 式 


signed 


[31 : 


0] 


overflow_pos_real, overflow_pos_img; 
overflow_neg_real, overflow_neg_img; 


no_overflow_real, no overflow img; 


p_ar b= a real * b real; 
p_ai_bi a_img * b_img; 
p_ai_br = a_img * b real; 


p_ar bi a real * b img; 


Ss real = p ar br - p_ai bi; 


signed [31:0] s_img = p_ar bi + p_ai br; 


// 在 一 半 的 位 置 含 入 为 s3 .14 格 式 


wire signed [17:0] 


wire signed [17:0] 


s real rnd = s_real[31:14] + s_real[13]; 


s img rnd = s_img[31:14] + s_img[13]; 


// 检查 溢出 并 固定 (第 17、16、15 位 不 相等 ) 
assign overflow pos real = 

(~s_real_rnd[17]) & (s_real_rnd[16] | s_real_rnd[15]); 
assign overflow_neg real = 

(s_real_rnd[17]) & ~(s_real_rnd[16] & s_real_rnd[15])j; 


assign no_overflow_real = ~(overflow_pos_real | overflow_neg_real) ; 


assign overflow pos img = 


(~“s_img_rnd[17]) & (s_img rnd[16] | s img rnd[15]); 


assign overflow neg img = 


(s_img_rnd[17] ) 


& ~(s_img_rnd[16] & s_img_rnd[15]); 


assign no_overflow_img = ~ (overflow pos img | overflow_neg_img) ; 


assign x_real = 


assign x_img 


({16{overflow_pos real}} & 16'h7fff) | 


({16{overflow neg real}} & 16’h8000) | 
({16{no_overflow_real}} & s real_rnd[15:0]); 


({16{overflow_pos_img}} & 16’h7fff) | 


({16{overflow neg_img}} & 16’h8000) | 
({16{no_overflow_img}} & s img rnd[15:0]); 


endmodule // complex mult 





图 13-2 ”复数 乘法 器 的 Verilog 代码 





a_real s1.14 











53.28 


4 A& |s1J4 Out_real 
饱和 


a img s1.14 














b_real s1.14 
53,28 


&A& |5114 Out_img 
饱和 


图 13-3 更 快 的 s1. 14 格式 的 定点 复数 乘法 器 。 该 实现 去 掉 了 每 个 乘法 器 中 的 最 后 一 个 加 法 
器 ， 而 是 通过 两 个 全 加 器 将 4 个 输出 值 削减 为 2 个 


13.2 定点 和 浮 点 格式 之 间 的 转换 

在 本 节 中 ， 将 介绍 一 种 8 位 浮 点 格式 ， 并 探讨 如 何在 12 位 带 符号 数 和 这 种 新 格式 之 间 进 行 转 
换 。 我 们 即将 使 用 的 这 种 格式 是 自 定义 的 ， 也 类 似 于 在 4 律 和 几 律 音频 压缩 中 使 用 的 格式 。 与 这 
些 格式 一 样 ， 它 将 12 位 带 符号 整数 压缩 为 一 种 8 位 的 表示 方法 。 但 它 不 能 表示 小 数 的 大 小 。 


13.2.1 浮 点 格式 


如 图 13-4 所 示 ，8 位 格式 表示 数值 的 范围 是 -2047 ~2047， 具 有 5 位 精度 。 这 种 格式 包含 
1 个 符号 位 、3 个 指数 位 和 4 个 尾数 位 。 用 隐 含 的 MSB 为 “1” 来 扩大 4 位 的 尾数 〈 见 习题 
11. 23) ， 以 表示 每 个 定点 数 的 5 个 最 高 有 效 位 。 为 了 准确 地 表示 小 于 16 的 数 ， 把 逐 级 下 溢 也 
包括 了 进来 (L 11.3.2 35). 

将 0 简单 地 表示 为 00s， 值 80,。( 负 0) 表示 一 个 运算 错误 | 符号 | 指数 | 尾数 | 
代码 。8 在 进行 运算 时 发 生 了 溢出 ， 则 将 结果 设置 为 80 以 表明 发 7 | 64 | 3:0 | 
生 了 错误 。 当 这 个 错误 代码 输入 任 一 浮 点 函数 (如 加 法 ) HBP, A 13-4 本 章 使 用 的 浮 点 格式 
出 将 自动 设置 为 这 个 错误 代码 。 

这 种 浮 点 格式 的 取 值 函数 由 下 式 给 出 : 

N l'm exp = 0 
— 1°2°'(10000, +m) exp #0 
为 了 提供 逐 级 下 溢 ， 指 数 为 0 和 1 时 均 将 二 进 制 小 数 点 编码 在 尾数 的 LSB 右边 。 区 别 在 于 ， 指 
数 > 0 ( 即 =1) 时 在 尾数 的 MSB 左 侧 有 一 个 隐 含 的 1， 而 指数 =0 时 则 没有 。 指 数 为 1 ~7 时 
有 一 个 工 的 偏 移 ， 即 尾数 左 移 e -1 位 可 以 得 到 该 值 。 
计算 浮 点 数 表示 的 公式 (GH TARE RAGA) 如 下 : 


b img s1.14 





(13-2) 


£= p <0 (13-3) 

= Hy log, ( |x|) <4 (13-4) 
Llog,( |x|) ] -3 log,( |x|) 24 

m= | (13-5) 
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为 了 用 浮 点 格式 编码 尾数 值 ， 尾 数 是 输入 的 最 高 有 效 的 5 位 (尾数 中 可 能 有 1 个 隐 含 的 
1 一 一 译 者 注 ) 。 指 数 则 编码 最 高 有 效 位 的 位 置 。 

转换 到 浮 点 数 还 要 包括 一 步 对 新 尾数 的 舍 入 。 采 用 一 个 简单 的 舍 人 操作 : 在 一 半 的 位 置 向 
上 舍 人 。 图 13-5 和 图 13-6 分 别 给 出 了 所 表示 的 值 和 相对 误差 。 这 种 表示 方法 的 相对 误差 不 会 
超过 3.1% , 并且 所 有 误差 的 第 一 个 值 是 33。 无 误差 的 表示 方法 仅 发 生 在 移出 的 位 数值 全 部 为 


0 的 时 候 。 
2000|[ Sie A 
12 位 定点 数 š 














Z > 


表示 的 值 
3 
S 
3 








200 
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整数 值 


图 13-5 定点 数 及 其 浮 点 表示 方法 。 截 断 操作 使 浮 点 数 小 于 或 等 于 初始 值 


表 13-1 给 出 了 几 个 示例 的 定点 数 及 其 浮 点 格式 。 
表 13-1 不 同 的 定点 值 及 其 浮 点 表示 。 第 三 列表 示 将 浮 点 数值 转换 回 12 位 定点 数 






定点 数 (hex) FRR (hex) 转换 的 浮 点 数 (hex)|| 定点 数 (hex) 
000 00 000 
003 


浮 点 数 (hex) ”转换 的 浮 点 数 (hex) 













13. 2.2 定点 数 到 浮 点 数 的 转换 


图 13-7 给 出 了 一 个 12 位 定点 数 到 8 位 浮 点 数 转 换 电 路 的 框图 。 首 先 用 反 相 电路 和 多 路 选 
择 器 将 输入 从 2 的 补 码 转换 为 符号 - 数值 码 。 其 次 ， 用 查找 第 一 个 1 的 电路 单元 找到 最 高 有 效 
的 1 ( 见 8.5 节 )。 
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图 13-7 定点 数 转换 为 浮 点 数 的 框图 


这 个 独 热 信 号 立即 输入 到 优先 编码 器 中 ， 对 3 位 指数 和 尾数 移 位 的 位 数 进行 编码 。 该 逻 
辑 将 输入 的 最 低 有 效 的 10 位 移 到 尾数 中 。 舍 人 一 个 数 可 能 会 导致 指数 增加 (并 可 能 会 导致 


iH). 


定点 数 到 浮 点 数 转换 电路 的 Verilog 代码 见 图 13-8. (EH casex 语句 找到 最 高 有 效 的 1， 
并 编码 指数 和 移 位 的 位 数 。 移 位 时 ， 模 块 保留 1 位 伟人 位 (mant_ing[0]), 然后 再 将 其 加 回 
到 尾数 中 。 在 舍 人 操作 之 前 若 尾 数 为 4 bl111， 则 将 滋 出 ， 然 后 将 指数 加 1。 若 指数 溢出 ， 则 
令 输 出 值 饱 和 。 在 所 提供 的 模块 中 ,输入 800,。( -2048) 不 会 转换 为 人 6， 而 是 转换 为 错误 代码 0 


x80。 习 题 13. 4 将 要 求 修复 这 个 缺陷 。 
13.2.3 浮 点 数 到 定点 数 的 转换 


浮 点 数 到 定点 数 转换 电路 的 框图 和 Verilog 代码 如 图 13-9 和 图 13-10 所 示 。 转 换 过 程 的 第 
一 步 是 检查 指数 是 否 等 于 0 来 确定 是 否 存 在 隐 含 的 1。 如 果 存在 这 个 1， 则 从 指数 中 减 去 1， 然 


后 依 规定 的 位 数 左 移 尾数 和 隐 含 的 位 。 最 后 ， 如 果 有 必要 ， 则 取 这 个 数值 的 相反 值 。 


# 3 ERER EH 


module fix2float_top(fixed, float); 


input [11:0] fixed; 
output [7:0] float; 


reg [2:0] exponent ; 


reg [2:0] shift; 


wire [10:0] magnitude = fixed[11] ? ~(fixed[10:0])+1 


wire sign = 


always@(*) begin 


fixed[11]; 


casex (magnitude [10:4] ) 


7'bixxxxxx: {exponent, shift} (3 biiL, 
7'bO1xxxxx: {exponent, shift} {3'b110, 
7'b001xxxx: {exponent, shift} {3’b101, 
7'b0001xxx: {exponent, shift} {3'b100, 
7'b00001xx: {exponent, shift} {3'b011, 
7'b000001x: {exponent, shift} {3'b010, 
7'b0000001: {exponent, shift} {3' b001, 
7'b0000000: {exponent, shift} {3’bo000, 
default: {exponent, shift} = 6’hx; 


endcase 
end 


// HERB, RERA 


3'b110}; 
3'b101}; 
3'b100}; 
3'b011}; 
3'b010}; 
3'b001}; 
3'b000}; 
3’b000}; 


wire [4:0] mant lng = {magnitude[9:0], 1'b0} >> shift; 


wire [4:0] mant = 


// + A 38 H 


mant_lng[4:1; + mant lng[0]; 


wire [3:0] new_exp = exponent + mant [4]; 


// 若 指 数 溢出 ， 则 令 输 出 值 饱 和 
assign float = new_exp[3] ? (sign, 3’h7, 4’hf} : 


{sign, new_exp[2:0], mant[3:0]}; 
// 即使 有 全 入 溢出 ,使 用 mant [3:0] 也 是 正确 的 ， 
// 因为 在 这 种 情况 Fmant[4:1]=mant[3:0]=4'b0000 
endmodule // fix2float top 


图 13-8 定点 数 到 浮 点 数 转换 的 顶层 Verilog 模块 


13.3 FIR 滤波 器 


本 节 详 细 介绍 4 阶 有 限 脉冲 响应 (FIR) 滤波 器 的 设计 。 给 定 一 组 4 输入 值 和 权重 ， 则 得 


到 该 模块 的 输出 : 


Y = Woxo + WX, + WAX, + 10,X; 
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fixed[10:0]; 


(13-6) 
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图 13-9 浮 点 数 到 定点 数 转换 电路 的 框图 


module float2fix(float, fixed) ; 
input [7:0] float; 
output [11:0] fixed; 


wire sign = float[7]; 
wire [2:0] exponent = float[6:4]; 
wire [3:0] mant = float[3:0]; 


wire [2:0] shift = (exponent == 0) ? 3'd0 : exponent-1; 
wire implied_one = (exponent != 0); 


wire [11:0] mag = {implied_one, mant} << shift; 


assign fixed = sign ? “mag + 1 : mag; 
endmodule // float2fix 


图 13-10 浮 点 数 到 定点 数 转 换 的 顶层 Verilog 模块 


也 就 是 说 ， 该 滤波 器 完成 一 个 四 元 向 量 w 和 x 的 点 积 。 输 入 值 和 输出 值 采用 13.2 节 的 
浮 点 格式 ， 权 重 按 1.4 的 定点 格式 。 对 于 所 示 的 实现 ， 将 权重 限制 为 正 数 ， 并 且 和 小 于 等 
Fi: 





š š 
O0<uw <l, Xu sl (13-7) 
i=0 


请 读者 在 习题 13.7 和 习题 13. 8 中 去 掉 这 些 限制 。 

由 于 我 们 的 浮 点 格式 仅 表示 一 个 12 位 动态 范围 (s11.0) ， 因 此 选择 按 定点 格式 进行 所 有 
的 运算 。 这 些 定点 电路 单元 将 比 对 应 的 浮 点 电路 单元 更 小 、 更 快 。 输 入 的 权重 值 为 无 符号 的 
1.4 格式 的 值 (16)。 为 了 避免 丢失 中 间 过 程 的 精度 ，s11.0 格式 x 1.4 格式 的 乘法 器 的 输出 要 
采用 sl1.4 的 定点 格式 。 由 于 限制 了 权重 的 和 小 于 等 于 1， 加 法 器 输出 一 个 s11.4 格式 的 值 。 
FIR 滤波 器 的 最 后 一 级 对 剩余 的 小 数 部 分 进行 舍 人 ， 并 转换 回 8 位 浮 点 格式 。 框 图 和 数 的 表示 
方法 如 图 13-11 所 示 。 

FIR 滤波 器 的 Verilog 代码 如 图 13-12 所 示 。 首 先 用 图 13-10 的 转换 块 将 每 个 浮 点 数 输入 转 
换 为 定点 数 。 然 后 ， 符 号 扩展 定点 值 (fixi) 并 乘 以 权重 (得 到 weighteaqai )。 舍 人 加 权 的 
数 的 和 ， 然 后 转换 回 浮 点 数 。 若 输入 了 一 个 错误 代码 ， 则 在 该 过 程 的 最 后 一 步 输出 一 个 错误 
代码 。 


图 13-11 
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换 为 12 位 定点 格式 。 所 有 中 间 值 都 是 定点 格式 且 位 数 设计 成 不 丢失 精度 


module fir(x0, xl, x2, x3, 
w0, wl, w2, w3, out); 
// 4 输入 浮 点 数 FIR 滤 波 器 
// 
// 如 果 4 个 输入 中 的 任 一 个 是 错误 代码 ， 则 输出 将 只 是 一 个 错误 
// 因为 限制 权重 为 小 于 等 于 1 
input [7:0] x0, xl, x2, x3; 


// 在 1.4 格 式 中 ,最 大 值 =16/16 


input [4:0] wO, wl, w2, w3; 


output [7:0] out; 
wire [11:0] fix0, fixl, fix2, fix3; 


// 加 权 的 浮 点 数 ，s11.4 格 式 

wire [15:0] weighted0, weighted1, weighted2, weighted3, 
wire [15:0] w_sum; 

wire [7:0] float_out; 

x0, £1x0); 


float2fix convo A 
xL, Kis); 


float2fix conv1 
float2fix conv2 (x2, fix2); 


fix3); 


( 
( 
( 
( 


float2fix conv3 (x3 


assign weightedo {{4{£ix0[11]}}, fixo} * 
assign weighted1l {{4{fix1l[11]}}, fix1} * 
assign weighted2 {{4{fix2[11]}}, fix2} * 
assign weighted3 {{4{£ix3[11]}}, fix3} * 
assign w sum = weighted0 + weightedl + weighted2 + weighted3; 





fix2float convOut (w_sum[15:4]+w_sum[3], float_out) ; 


图 13-12 浮 点 数 FIR 滤波 器 的 Verilog 模块 
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FIR 滤波 器 框图 。 所 有 权重 必须 为 正 数 且 和 小 于 等 于 1。 该 滤波 器 将 8 位 浮 点 输入 转 
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wire error; 
// 如 果 任 何 输入 是 一 个 错误 代码 ， 则 输出 也 应 该 是 一 个 错误 代码 


assign error = (in0 == 8'h80) | (inl == 8’h80) | 


(in2 == 8’h80) | (in3 == 8'h80); 
assign out = error ? 8'h80 : float_out; 
endmodule // fir 





图 13-12 (#) 


小 结 

在 本 章 中 ， 你 看 到 了 三 个 扩展 的 示例 ， 汇 集 了 从 第 10 ~ 12 章 学 到 的 很 多 内 容 。 复 数 乘法 
器 举例 说 明了 在 使 用 定点 数 时 出 现 的 溢出 和 精度 问题 ， 以 及 如 何 使 用 含 人 和 饱和 来 处 理 这 些 
问题 。 

我 们 对 定点 数 到 浮 点 数 转换 的 讨论 (基于 流行 的 音频 压缩 标准 ) 给 出 了 相对 精度 的 浮 点 
表示 法 的 优点 ， 并 且 举 例 说 明了 许多 浮 点 表示 法 的 细节 。 这 种 表示 法 包括 隐 含 的 1 和 和 逐 级 下 
溢 ， 在 转换 期 间 要 注意 伟人 和 规格 化 。 

最 后 一 个 示例 是 有 限 脉 冲 响应 滤波 器 。 这 个 模块 举例 说 明了 多 种 记 数 制 的 使 用 。 它 具有 浮 
点 数 输 入 和 输出 、 定 点 数 权重 ， 并 用 定点 数 执行 其 内 部 计算 〈 它 使 用 我 们 的 定点 数 到 浮 点 数 转 
换 模块 相互 转换 ) 。 要 关注 内 部 表示 法 的 给 定 范围 和 精度 ， 以 避免 溢出 或 丢失 精度 。 


文献 说 明 
k- 律 的 版 本 来 自 G.711 标准 [56] 。 


习题 

13.1 更 快 的 复数 乘法 ， 设 计 。 给 出 图 13-3 中 复数 乘法 电路 的 详细 设计 (包括 连 线 的 位 宽 和 华 莱 士 树 )。 
不 需要 编写 Verilog 代码 ， 而 是 以 简单 的 方式 描述 该 模块 。 

13.2 更 快 的 复数 乘法 ， 实 现 。 编 写 并 验证 Verilog 代码 ， 实 现 习 题 13. 1 的 设计 。 

13.3 更 为 复杂 的 乘法 。 为 8 个 不 同 的 s1. 14 格式 的 复数 相 乘 的 模块 的 设计 、 编 写 和 验证 Verilog 代码 。 
并 在 最 终 输 出 步骤 之 前 不 丢失 精度 。 

13.4 定点 数 到 浮 点 数 的 转换 。 图 13-8 的 定点 数 转换 模块 ， 给 定 的 输入 值 800,6 不 能 正确 工作 ， 修 复 这 个 
问题 。 

13.5 定点 数 到 浮 点 数 的 转换 ， 截断。 用 截断 的 方案 (丢弃 被 移出 的 位 ) 代替 舍 人 的 方案 ， 修 改 图 13-8 
的 定点 数 到 浮 点 数 转换 电路 。 这 种 格式 的 最 大 表示 误差 是 多 少 ? 以 图 表 方式 给 出 所 有 输入 数 的 
误差 。 

13.6 3F5 浮 点 数 。 编 写 一 个 定点 到 浮 点 和 浮 点 到 定点 转换 电路 的 Verilog 代码 ， 可 以 在 32 位 带 符 号 整数 
Al 3ES 浮 点 数值 之 间 转 换 。 该 格式 有 1 个 符号 位 、5 个 指数 位 (最 大 值 29)、1 个 隐 含 的 1 和 2 个 
尾数 位 。 采 用 1 个 隐 含 的 1、 逐 级 下 溢 和 截断 。 这 种 表示 方法 仅 允 许 用 表示 输入 值 的 3 个 MSB 来 
进行 4 倍 的 数据 压缩 。 最 大 的 表示 误差 是 多 少 ? 

13.7 扩展 FIR 滤波 器 ， 工 。 修 改 图 13-12 的 FIR 滤波 器 ， 可 接受 2.5 格式 的 权重 ， 仅 受 以 下 约束 : 


3 
-1< w <1 


13.8 JR FIRS, H. BUIH 13.7 的 FIR 滤波 器 ， 并 去 掉 对 权重 求 和 的 约束 。 确 保 检查 溢出 。 

13.9 HR FIRB, H. AAR 13-12 的 FIR 滤波 器 模块 (不 用 修改 ) ， 设 计 一 个 16 阶 FIR 函数 ， 
求 出 所 有 16 个 输入 的 平均 值 。 欲 使 委 失 的 精度 最 小 ， 需 要 修改 滤波 器 的 哪些 部 分 能 完全 不 丢失 
精度 ? 
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13. 10 


13. 11 


13. 12 


13. 13 


13. 14 
13. 15 


把 它 放 在 一 起 。 绘制 一 个 复杂 的 4 阶 FIR 滤波 器 的 框图 。 输 入 值 和 最 终 的 输出 是 3E5 格式 的 复 
数 。 权 重 是 81. 4 定点 格式 的 复数 。 请 务必 标明 所 有 中 间 连 线 的 数字 格式 和 位 宽 。 在 最 后 的 输出 
之 前 不 能 丢失 精度 。 
RR, 一 个 向 量 (a, a,, a.) 与 男 一 个 向 量 (b,, 6,, b.) 的 又 积 可 以 得 到 另 一 个 向 量 (c,, 
Cys Eda 其 中 : 

c= a,b, - a,b, 

cy = a,b, - a,b, 

c, = a,b, — a,b, 
设计 一 个 模块 ， 其 具有 两 个 33. 14 格式 的 三 维 向 量 的 输入 和 一 个 三 维 向 量 的 输出 。 输 出 向 量 不 是 
由 s3. 14 格式 的 数组 成 ， 而 是 由 不 会 造成 丢失 精度 的 最 少 位 宽 的 数组 成 。 
近似 的 平方 根 。 为 了 得 到 0.5 和 2 之 间 的 数 的 平方 根 的 近似 值 ” ， 可 由 下 式 计 算 该 近似 值 : 


= x-1 (x-1) (x -1)? 
Va = 14 & 16 


设计 并 编写 一 个 用 上 面 公式 计算 数 1. 8 的 近似 平方 根 的 Verilog 模块 。 可 以 假设 输入 介 于 0.5 和 2 
之 间 。 你 要 输出 一 个 数 1.8 的 近似 平方 根 ， 但 又 不 会 丢失 任何 的 中 间 精 度 。 对 于 0.5 和 2 之 间 所 
有 的 数 ， 最 坏 情况 下 的 误差 是 多 少 ? 
近似 的 除法 。 为 了 得 到 0.5 和 1 之 间 的 数 的 倒数 的 近似 值 ? ， 给 出 : 
一 ~ {etl —2) + (CL -at 01-2)? + 0-29" 

(a) FARRAH M x =0.5 到 x=1 该 近似 值 的 误差 。 
(b) 设计 一 个 被 除数 乘 以 除数 的 倒数 的 浮 点 数 除 法 器 模块 (23E8 格式 ) 。 应 提供 一 个 至 少 与 图 11-1 

的 框图 一 样 详细 的 框图 。e 
BCD 到 二 进 制 。 设 计 并 编写 一 个 Verilog 代码 模块 ， 将 4 位 无 符号 BCD 码 转 换 为 14 位 二 进 制 数 。 
二 进 制 到 BCD。 设 计 并 编写 一 个 Verilog 代码 模块 ， 将 14 位 无 符号 二 进 制 转换 为 4 位 BCD 码 。 








日 ”通过 计算 在 x=1 附近 的 Vx 的 泰勒 级 数 得 到 。 
O ”通过 计算 在 *=1 附近 的 1/x 的 泰勒 级 数 得 到 。 
O 请 注意 ， 很 少 有 系统 允许 在 除法 运算 中 出 现任 何 错误 。 
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时 序 逻 辑 的 输出 信号 不 仅 取决 于 它 的 输入 信号 ， 还 取决 于 它 的 状态 ， 该 状态 反映 其 输入 信 
号 的 历史 信息 。 我 们 通过 反馈 电路 构成 时 序 逻 辑 电路 ， 反 馈 电路 将 组 合 逻辑 电路 计算 出 来 的 状 
态 变量 作为 输入 信和 号 重新 输送 给 电路 。 一 般 的 时 序 逻 辑 含有 异步 反馈 电路 ， 由 于 多 个 状态 位 可 
以 在 不 同时 刻 发 生变 化 ， 因 此 设计 和 分 析 都 比较 复杂 。 在 本 章 中 我 们 将 我 们 的 设计 和 分 析 任 务 
进行 简化 ， 限 制 为 同步 时 序 罗 辑 ， 在 同步 时 序 逻 辑 中 状态 变量 保存 在 寄存 器 中 ， 只 有 在 时 钟 信 
号 (dk) 上 升 沿 时 状态 变量 才 进 行 更 新 。 

同步 时 序 逻 辑 电 路 的 行为 或 有 限 状 态 机 (FSM) 完全 由 两 个 逻辑 函数 进行 描述 : 一 个 函数 
由 其 输入 信号 和 当前 状态 来 计算 下 一 个 状态 ， 另 一 个 函数 由 其 输入 信号 和 当前 状态 来 计算 输出 
信号 。 我 们 用 状态 表 或 状态 图 来 描述 这 两 个 函数 。 如 果 用 符号 表示 状态 ， 状 态 分 配 将 符号 状态 
映射 到 一 组 位 向 量 , 通 常用 二 进 制 和 独 热 码 表示 状态 分 配 。 

给 定 状 态 表 (或 状态 图 ) 和 状态 分 配 ， 实 现 有 限 状 态 机 就 是 简单 地 合成 下 一 个 状态 和 输 
出 逻辑 函数 。 对 于 独 热 状态 编码 来 说 ， 合 成 过 程 很 简单 ， 每 一 个 状态 映射 到 各 自 的 触发 器 ， 状 
态 图 里 所 有 指向 一 个 状态 的 边 映射 为 触发 器 的 输入 逻辑 函数 。 对 于 二 进 制 编码 ， 将 状态 向 量 位 
构成 的 卡 诺 图 进行 化 简 并 表示 为 逻辑 公式 即 可 。 

用 Verilog 语言 实现 有 限 状 态 机 时 ， 声 明 一 个 状态 寄存 器 保存 当前 状态 ， 用 组 合 逻 辑 描述 
下 一 个 状态 和 输出 函数 ， 可 以 用 第 7 章 介绍 的 case 语句 来 完成 。 状 态 分 配 需要 用 'define if 
句 进行 定义 ， 从 而 在 状态 分 配 发 生变 化 时 不 需要 变更 状态 机 本 身 的 描述 。 这 里 需要 特别 注意 在 
启动 状态 时 将 FSM 复位 到 一 个 已 知 的 状态 。 


14.1 时 序 电 路 


回想 一 下 ,组合 逻辑 电路 产生 输出 信号 只 依赖 于 其 输入 信号 的 当前 状态 。 组 合 电路 必须 
不 能 有 循环 。 如 果 我 们 将 反馈 电路 加 入 组 合 电路 中 ,创建 一 个 如 图 14-1 所 示 的 循环 ， 电 路 
就 变 成 了 时 序 电路 。 时 序 电路 的 输出 信号 不 仅 取决 于 当前 的 输入 信号 ， 还 取决 于 先前 的 输 
入 信和 号。 反馈 电路 创建 的 循环 允许 电路 存储 当前 输入 
信号 的 信息 。 我 们 将 存储 在 反馈 信号 中 的 信息 称 作 电 
路 的 状态 。 

时 序 电路 产生 的 输出 信号 可 以 表示 为 电路 输入 信 
号 和 当前 状态 的 函数 。 电 路 生成 的 下 一 个 状态 也 是 输 
入 信号 和 当前 状态 的 函数 。 

图 14-2 给 出 了 一 个 reset-set CRS) 触发 器 ， 该 触 图 14-1 将 携带 状态 信息 的 反馈 路 径 添加 


state 





发 器 是 由 两 个 或 非 门 组 成 的 非常 简单 的 时 序 逻 辑 电 到 组 合 电路 中 就 构成 了 时 序 电 
Bt 输出 信号 q 作为 一 个 状态 变量 反馈 到 输入 端 。 电 路 。 时 序 电路 的 输出 信和 号 取决 于 
路 行为 由 方程 式 g =7 人 (sVg) 表 示 。 状 态 变 量 q 在 方 当前 输入 信号 和 当前 状态 ， 可 以 
程式 两 边 都 出 现 了 。 为 了 更 加 清楚 地 表示 动态 关系 ， 用 历史 输入 信号 的 函数 表示 


O 我们 将 在 第 26 章 重新 考虑 异步 时 序 电 路 。 
O 我们 画 出 的 电路 图 如 图 14-2a 所 示 。 其 他 不 遵守 冒 泡 规则 的 人 画 出 的 电路 图 如 图 14-2b 所 示 。 
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我 们 将 方程 式 重新 写 为 qu ETA (SV gw)。 也 就 是 说 ,方程 式 告诉 我 们 如 何在 函数 中 通过 输 
入 信号 和 4 的 old 状态 来 获得 g 的 new 状态 。 


从 方程 式 和 原理 图 可 以 很 容易 地 看 出 ， 当 r = 1， ; š 
q =0 时 触发 器 复位 ; 当 s=1, r=0, q=1 Wha A 
置 位 ; 当 s=0, r=0 时 ,输出 信号 g 保持 状态 不 变 。 : r z 


输出 信号 q 的 值 反 映 了 哪个 信号 最 后 的 输入 是 高 电 
Po WRES r 最 后 状态 为 高 电 平 ， 则 q =0。 如 果 图 14-2 RS 触发 器 就 是 一 个 简单 的 时 序 电 
最 后 状态 为 高 电 平 ， 则 q = 1. 我们 将 以 上 行为 总 结 路 实例 : a) 原理 图 ; b) 不 遵循 
成 如 表 14-1 所 示 的 状态 表 。 冒 泡 规 则 的 备 选 原理 图 

由 于 时 序 电 路 的 功能 依赖 于 随 着 时 间 推 移 信 号 的 演变 ， 我 们 一 般 用 时 序 图 来 描述 时 序 电 路 
的 行为 。 图 14-3 所 示 的 时 序 图 显示 了 RS 触发 器 的 操作 过 程 。 该 图 将 信号 ~、*、4 的 波形 、 信 
号 电 平 显 示 为 时 间 的 函数 。 时 间 从 左 到 右 递增 。 从 一 个 信号 到 另外 一 个 信号 之 间 的 箭头 表示 信 
号 之 间 产 生 影响 的 关系 。 


表 14-1 RS 触发 器 状态 表 





r s Qua Anew r s foid Anew 
0 0 0 0 0 l X 
0 0 1 1 1 X X 0 





q 
时 间 一 一 = 


图 14-3 时序 图 显示 了 RS 触发 器 的 操作 过 程 。 信 和 号 值 随 着 时 间 变 化 从 左 到 右 顺序 显示 


最 初 q 处 于 未 知 状态 ，9 可 以 是 高 电 平 也 可 以 是 低 电 平 ， 在 图 中 两 种 状态 都 表示 出 来 。 在 
ti 时刻,，r 变 为 高 电 平 ，g 变 为 低 电 平 ， 触 发 器 复位 。 在 已 时 刻 ， 信 号 s 变 为 高 电 平 ，g 出 现 上 
升 沿 ， 触 发 器 置 位 。 在 t 时 刻 ， 触 发 器 再 一 次 复位 。 在 如 时 刻 ， 信 号 * 变 为 高 电 平 ， 由 于 信号 
r 保 持 高 电 平 ， 信 号 s 的 这 次 变化 没有 影响 输出 信号 的 值 。 在 ts 时刻， 信号 s 变 为 高 电 平 ， 同 
时 信号 保持 低 电 平 ， 完 成 触发 器 的 置 位 。 在 吉 时 刻 ， 当 7 变 为 高 电 平 时 ， 尽 管 信号 s 保持 高 
电 平 ， 触 发 器 又 一 次 复位 。 在 时刻 ， 当 信号 7 变 为 低 电 平时 ,触发 右 最 后 一 次 置 位 。 


14.2 同步 时 序 电 路 

图 14-2 所 示 的 RS 触发 器 比较 简单 ， 很 容易 理解 ， 但 是 任意 一 个 包含 多 位 状态 反馈 的 时 序 
电路 的 行为 都 会 很 复杂 。 复 杂 性 一 定 程度 上 是 由 于 下 一 个 状态 信和 号 的 不 同位 会 在 不 同 的 时 刻 发 
生变 化 而 引起 的 。 竞 争 可 以 产生 下 一 个 状态 输出 信号 ， 这 取决 于 电路 延迟 。 在 第 26 EH, R 
们 再 讨论 通用 的 异步 时 序 电 路 。 在 此 之 前 我 们 将 注意 力 集中 在 同步 时 序 电 路 上 ， 在 同步 时 序 电 
路 中 ， 时 钟 存储 元 件 用 来 保证 所 有 状态 变量 在 同一 时 刻 改变 状态 ， 即 跟 时 钟 信 号 同步 。 同 步 时 
序 电路 也 称 作 有 限 状 态 机 或 FSM。 

图 14-4 给 出 了 一 个 同步 时 序 逻 辑 电 路 的 框图 。 该 电路 通过 一 个 * 位 宽 的 D 触发 器 (s 表 
示 状 态 的 位 宽 ) 打破 了 状态 反馈 回路 ， 成 为 同步 电路 。 该 触发 器 在 时 钟 信号 上 升 沿 到 来 时 ， 
根据 输入 信号 的 值 更 新 输出 信号 ， 这 些 将 在 15. 2 节 中 进一步 介绍 。 在 其 他 时 刻 ， 输 出 信和 号 
保持 不 变 。 在 反馈 回路 中 加 入 D 触发 器 可 以 约束 所 有 状态 位 在 同一 时 刻 发 生变 化 ， 从 而 消 
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除了 竞争 。 

图 14-5 所 示 的 时 序 图 列举 了 同步 时 序 电路 的 
操作 过 程 。 在 每 一 个 时 钟 周期 ， 时 间 从 时 钟 信号 
的 一 个 上 升 沿 到 下 一 个 上 升 沿 , 一 个 组 合 逻 辑 模 
块 通过 输入 信号 和 当前 状态 的 组 合 函 数 计算 下 
一 个 状态 和 输出 信号 (图 中 没有 显示 )。 在 每 
次 时 钟 信号 上 升 沿 ， 根 据 前 一 个 时 钟 周 期 计算 
的 下 一 个 状态 值 ， 对 当前 状态 (state) 进行 





图 14-4 同步 时 序 电 路 通过 时 钟 存储 元 件 打破 
状态 反馈 回路 (在 此 例 中 用 的 是 D 


更 新 。 
触发 器 ) 。 触 发 器 保证 所 有 状态 变量 
例如 ， 在 图 14-5 的 第 一 个 时 钟 周 期 ， 当前 状 在 时 钟 上 升 沿 到 来 的 同一 时 刻 改变 状 
态 是 SB， 输 入 信号 在 时 钟 周期 结束 之 前 变 为 B。 


组 合 逻辑 计算 下 一 个 状态 SC =f(B,SB)。 在 时 钟 
周期 结束 时 ， 时 钟 信号 再 一 次 出 现 上 升 沿 ， 这 时 候 当 前 状态 变 为 SC。 并且 在 下 一 个 时 钟 上 升 
沿 到 来 之 前 一 直 保持 SC 状态 。 










next X |] ( |SC=fBSB) X | 


— s 


State_SA|X SB [|X SCc |) 


图 14-5 时序 图 列举 了 同步 时 序 电路 的 操作 过 程 。 在 每 次 时 钟 信号 clk 的 上 升 沿 到 来 时 状态 发 生变 化 


我 们 可 以 通过 clock-by-clock 原理 分 析 同 步 时 序 电路 。 在 给 定 的 时 钟 周期 内 下 一 个 状态 和 
输出 信号 的 值 只 依赖 于 当前 状态 和 该 时 钟 周期 内 的 输入 信号 值 。 在 每 一 个 时 钟 上 升 沿 ， 当 前 状 
态 变更 到 下 一 个 状态 。 

例如 ， 假 设 按 照 表 14-2 给 出 下 一 个 状态 和 输出 逻辑 。 如 果 电 路 启动 状态 为 00， 在 前 9 个 
周期 输入 序列 011011011， 那 么 每 个 周期 的 电路 状态 和 输出 信号 将 是 什么 ? 

我 们 的 实例 电路 的 操作 过 程 如 表 14-3 所 示 。 在 周期 0 电路 从 00 状态 启动 。 在 这 个 周期 内 
输入 信号 和 输出 信号 都 是 0。 在 00 状态 输入 信号 0， 则 下 一 个 状态 还 是 00， 因 此 在 周期 1 电路 
状态 仍然 保持 00， 但 是 输入 信号 变 为 1。 在 00 状态 下 输入 信号 1 导致 在 周期 2 进入 状态 01。 
在 状态 01 输入 1， 则 在 周期 3 进入 状态 11。 在 周期 3 状态 11 时 ,- 输入 信号 变 为 0， 则 在 周期 4 
状态 变 回 01。 在 周期 4、5， 输 入 信和 号 保持 高 电 平 ， 则 状态 值 在 周期 5 和 周期 6 分 别 为 11 10 
在 周期 6 输入 低 电 平 ， 则 到 周期 7 状态 变 回 11 。 在 周期 7 和 8 保持 高 电 平 输入 信号 ， 则 状态 信 
号 在 周期 8 和 9 分 别 为 10 和 00。 在 周期 8 由 于 状态 为 10 并 且 输入 信号 为 1， 所 以 输出 信号 变 
为 1。 

状态 表 是 有 限 状 态 机 的 一 种 表示 方式 ， 像 表 14-2 那样 ， 以 表格 的 形式 给 出 下 一 个 状态 和 
输出 信号 的 函数 关系 。 男 一 种 类 似 的 图 形 表 示 方 式 称 为 状态 图 ， 如 图 14-6 所 示 。 


表 14-2 同步 逻辑 电路 实例 的 状态 表 














状 下 一 个 状态 输 出 下 一 个 状态 输 出 
in=0 in =1 in=0 in=1 in=0 in=1 in=0 in =1 
00 00 01 0 0 01 10 0 0 
01 00 ll 0 0 ll 00 0 1 
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表 14-3 表 14-2 所 描述 的 时 序 逻 辑 电路 在 输入 信号 序列 011011011 时 的 状态 序列 











图 14-6 表 14-2 所 描述 的 有 限 状态 机 的 状态 图 。4 个 圆圈 代表 4 个 状态 。 每 个 箭头 表示 从 当前 
状态 到 下 一 个 状态 的 状态 转换 ， 并 且 标明 了 输入 /输出 信号 ， 输 入 信号 引发 状态 转换 ， 
输出 信号 表明 在 当前 状态 下 输入 此 输入 信号 时 产生 的 输出 结果 

在 图 14-6 中 ， 每 一 个 圆圈 代表 一 个 状态 。 并 且 标 记 为 状态 的 名 字 。 在 这 里 我 们 用 状态 变 

量 的 值 作为 状态 的 名 称 。 稍 后 我 们 将 介绍 独立 于 状态 编码 的 符号 化 的 状态 名 称 。 下 一 个 状态 函 
数 用 箭头 表示 。 每 一 个 箭头 都 表示 一 次 状态 转换 ， 并 且 标 注 了 在 此 次 转换 过 程 中 输入 信号 和 输 
出 信号 的 值 。 例如， 从 状态 00 到 状态 01 的 箭头 ， 标 注 了 1/0， 表示 在 状态 00 且 输 入 信号 为 1 
时 ， 下 一 个 状态 为 01， 并 且 输 出 信号 为 0。 需 要 注意 的 是 ， 箭 头 可 以 从 一 个 状态 转换 到 该 状态 
本 身 ， 比 如 在 状态 00 时 输入 信号 0， 则 状态 00 保持 不 变 。 同 样 ， 在 状态 图 中 状态 转换 可 能 跨 
越 很 长 的 距离 ， 比 如 在 状态 10 时 输入 信号 1， 则 转换 为 状态 00, 


14.3 交通 灯 控 制 器 

作为 FSM 的 第 二 个 实例 ， 考 虑 一 下 在 一 个 南北 道路 和 东西 道路 的 十 字 路 口 控制 交通 灯 的 问 
题 ， 如 图 14-7 所 示 。 需 要 控制 6 个 信号 灯 : 南北 方向 和 东西 方向 的 绿灯 、 黄 灯 和 红 灯 。FSM 定义 
了 输入 信号 carew 表示 有 车 在 东西 方向 路 口 等 待 ， 输 入 信号 rst 表示 将 FSM 重 置 到 已 知 状 态 。 

对 该 FSM 的 描述 如 下 : 

1) 当 南 北方 向 信号 灯 为 绿灯 并 且 东 西方 向 信号 灯 为 红 灯 时 ， 将 FSM 重 置 到 某 一 状态 。 

2) 当 检 测 到 东西 方向 有 车 时 (carew =1) ， 经 过 一 系列 状态 转换 使 得 东西 方向 信号 灯亮 绿 
灯 ， 然 后 再 变 回 南北 方向 信号 灯亮 绿灯 。 

3) 信号 灯 变 化 时 ， 如 果 某 个 方向 的 信号 灯 为 绿灯 ， 则 需要 先 变 为 黄 灯 之 后 才能 变 为 红 灯 。 

4) 只 有 当 一 个 方向 的 信号 灯 为 红 灯 时 ， 另 外 一 个 方向 的 信号 灯 才 能 够 是 绿灯 。 

图 14-8 给 出 了 一 个 符合 我 们 规范 的 FSM 状态 图 。 该 图 同 图 14-6 所 示 的 状态 图 相 比 有 两 
个 主要 的 不 同 点 。 首 先 ， 状 态 用 符号 名 称 进行 标注 。 其 次 ， 输 出 信号 的 值 放 在 了 状态 下 边 ， 
而 不 是 标注 在 转换 过 程 中 。 这 样 表示 是 因为 在 此 实例 中 输出 信号 只 是 状态 的 函数 ， 而 跟 输 
人 信和 号 无 关 。® 

FSM 重 置 到 GNS 状态 (南北 方向 为 绿灯 )。 在 此 状态 下 输出 信号 为 100 001。100 表示 南北 
方向 信号 灯 状 态 (绿灯 - 黄 灯 =- 红 灯 )。001 表示 东西 方向 信号 灯 状 态 (也 是 绿灯 - BEAT - ZT. 
灯 )。 因 此 此 状态 下 南北 方向 信号 灯亮 绿灯 ， 东 西方 向 信号 灯亮 红 灯 。 此 复位 状态 满足 规范 的 


O 如 果 FSM 的 输出 信号 的 值 只 依赖 于 当前 状态 ， 而 跟 输 入 信和 号 的 值 无 关 ， 则 该 PSM 称 作 摩 尔 型 有 限 状 态 机 
(Moore machine) 。 如 果 FSM 的 输出 信号 依赖 于 当前 状态 和 输入 信和 号 的 值 ， 则 该 FSM 称 作 米利 型 有 限 状 态 机 
(Mealy machine) 。 
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图 14-7 JH FSM 在 十 字 路 口 控 制 交 通 灯 。 该 FSM 有 两 个 输入 信号 : 复位 信号 Ost), KRE 
在 东西 向 马路 等 待 的 信号 (carew)。 该 FSM 有 6 个 输出 信号 来 控制 三 个 南北 方向 交通 
KT (RR. BR ZL) 和 三 个 东西 方向 交通 灯 


001 010 





output 
ns ew 
图 14-8 ”交通 灯 控制 器 FSM 的 状态 图 。 用 符号 名 称 标记 各 种 状态 。 在 每 种 状态 下 给 出 输出 信 
号 的 值 (南北 方向 的 绿灯 - BEAT - 红 灯 【〈 三 位 ) 以 及 东西 方向 的 绿灯 - 黄 灯 - ZT 
灯 )。 省 略 了 复位 箭头 。FSM 复位 状态 为 CNS 
第 一 条 。 标 注 为 carew 的 箭头 保持 GNS 状态 ， 直 到 东西 方向 检测 到 有 车 辆 出 现 。 

当 东 西方 向 检测 到 车 辆 时 ， 信 号 carew 变 为 真 ， 时 钟 信号 的 下 一 个 上 升 沿 到 来 时 ， 状 态 机 
进入 YNS 状态 (南北 方向 变 成 黄 灯 )。 在 此 状态 下 输出 信号 值 为 010 001。010 意味 着 南北 方向 
亮 黄 灯 ，001 意味 着 东西 方向 亮 红 灯 。 在 东西 方向 信号 灯 变 为 绿灯 之 前 ， 即 状态 从 GNS 转换 到 
GEW 之 前 ， 先 转换 到 YNS 状态 满足 规范 中 第 三 条 要 求 。 从 状态 YNS 出 来 的 箭头 没有 标注 ， 意 
味 着 YNS 状态 无 条 件 转换 到 GEW 状态 (除非 FSM 复位 ) 。 

GEW 状态 〈 东 西方 向 亮 绿灯 ) 一 般 都 紧 随 YNS 状态 之 后 。 在 此 状态 时 输出 信号 的 值 为 
001 100 ， 表 示 南 北方 向 亮 红 灯 并 且 东 西方 向 亮 绿 灯 。GEW 状态 及 其 转换 序列 部 分 满足 规范 中 
第 二 条 要 求 。GEW 状态 之 后 一 般 紧 接着 进入 YEW 状态 。YEW 状态 〈 东 西方 向 亮 黄 灯 ) 的 输 
出 信号 为 001 010 ， 表 示 南 北方 向 亮 红 灯 同 时 东西 方向 亮 黄 灯 。YEW 状态 满足 规范 第 三 条 要 
求 ， 即 从 GEW 状态 转换 到 GNS 状态 时 ， 需 要 先 转换 为 中 间 状 态 YEW, 

K 14-4 给 出 了 交通 灯 控 制 器 的 状态 表 。 没 有 显示 复位 。 在 习题 14.3 ~ 习题 14.9 中 ,我 们 
将 对 此 基本 的 交通 灯 控 制 器 进行 某 些 方面 的 扩展 。 


表 14-4 交通 灯 控 制 器 FSM 的 状态 表 。FSM 重 置 到 GNS 状态 











下 一 个 状态 下 一 个 状态 
状态 输出 状态 输出 
carew =0 carew =1 carew =0 carew =1 
GNS GNS YNS 100 001 GEW YEW YEW 001 100 
YNS GEW GEW 010 001 YEW GNS GNS 001 010 
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例 14-1 状态 机 

为 一 个 给 脉冲 序列 中 填充 缺失 脉冲 的 状态 机 画 出 状态 图 。 正 常情 况 下 输入 信号 @ # 5 个 周 
期 出 现 一 个 周期 的 高 电 平 。 当 输入 信号 a 在 预计 的 周期 或 前 一 个 周期 变 为 高 电 平时 ,输出 信号 
q 将 在 下 一 个 周期 变 为 高 电 平 。 如 果 输 入 信号 a 提前 或 推迟 一 个 周期 ， 时 序 将 重 置 ， 预计 5 个 
周期 后 信号 a 再 次 变 为 高 电 平 。 如 果 输 入 信号 a 提前 或 推迟 两 个 周期 ， 它 将 被 忽略 不 计 。 如 果 
在 预计 的 周期 内 a 没有 出 现 ， 则 输出 信号 g 仍然 在 此 预计 周期 之 后 变 为 高 电 平 。 


图 14-9 例 14-1 描述 的 脉冲 填充 器 FSM 的 状态 图 


图 14-9 所 示 的 状态 图 包含 8 个 状态 。 每 个 状态 下 的 输出 信号 显示 在 状态 名 下 边 。 当 系统 
复位 时 ， 状态 机 从 状态 尺 启 动 ， 等 待 输入 信号 a 的 第 一 次 脉冲 信号 。 当 脉冲 信号 到 来 时 ， 状态 
机 转换 到 状态 1 并 且 输 出 1。 在 状态 1、2、3 时 无 论 输 入 信号 a 为何 值 ， 状 态 机 都 将 继续 转换 
到 状态 2、3、4。 如 果 在 状态 4 时 输入 信号 a 为 高 电 平 ( 提 前 一 个 周期 )， 则 状态 机 转换 到 状 
态 1 一 一 重 置 时 序 。 在 状态 5 时 ， 如 果 脉 冲 出 现在 预期 的 时 间 ， 则 状态 转换 为 状态 1 重启 
脉冲 序列 。 如 果 在 状态 5 时 输入 信号 a 为 0， 控制 状态 转换 到 状态 M， 该 状态 下 输出 信号 q 保 
持 高 电 平 来 处 理 丢失 的 或 迟到 的 脉冲 。 如 果 在 状态 用 时 输入 信号 a 为 高 电 平 ， 控 制 状态 转换 
为 状态 也， 为 后 续 脉 冲 重 置 时 序 。 和 否则 ， 控 制 状态 转换 到 状态 2 来 处 理 丢失 脉冲 而 不 需要 重 置 
时 序 。 


14.4 ”状态 分 配 


如 果 像 图 14-8 或 者 表 14-4 那样 用 符号 化 的 状态 名 称 来 详细 说 明 FSM ， 在 实现 FSM 之 前 就 
需要 给 状态 分 配 实际 的 二 进 制 值 。 这 个 给 状态 分 配 值 的 过 程 称 作 状态 分 配 。 

对 于 同步 状态 机 ， 只 要 每 个 状态 的 值 是 唯一 的 ， 我 们 就 可 以 给 状态 分 配 任意 值 的 集合 。” 要 表 
示 六 种 状态 至 少 需要 5,;, =log, (N); 然而 ， 用 最 少 的 位 数 进行 状态 分 配 往往 不 是 最 佳 状态 分 配 
方法 。 我 们 将 状态 向 量 的 每 一 位 称 作 状态 变量 。 

kk Kat ru N 位 表示 N 种 状态 。 每 个 状态 都 有 自己 单独 的 一 位 表示 。 当 状态 机 处 
于 第 i 种 状态 时 ， 状 态 变 量 相 应 的 第 i 位 4 为 1。 在 所 有 其 他 状态 时 4b, 为 0。 表 14-5 给 出 了 交 
通 灯 控制 器 FSM 的 独 热 码 状态 分 配 情况 。 在 这 个 表 中 , 用 4 位 表示 4 种 状态 。 在 任意 状态 下 都 
只 有 一 位 为 1。 接 下 来 我 们 将 看 到 ， 通 过 使 用 独 热 码 进 行 状态 分 配 使 得 有 限 状 态 机 的 逻辑 设计 
变 得 相当 简单 。 

二 进 制 状态 分 配 使 用 最 少 位 数 S... = log, (入) 来 表示 NN 种 状态 。 包 含 VW! 种 可 能 的 二 进 制 状 
态 分 配 (4 个 状态 24 种 ) 结果 ， 你 选择 哪 种 分 配 结果 并 不 重要 。 然 而 大 量 的 学 术 论文 已 经 论 
述 了 关于 选择 好 的 状态 分 配方 法 来 最 小 化 实现 电路 逻辑 ， 实 际 上 这 并 不 重要 。 除 了 在 非常 罕见 








O ”对 于 异步 机 就 不 能 这 样 随意 分 配 ， 需 要 谨慎 小 心 进 行 状 态 分 配 来 避免 竞争 。 
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的 情况 下 ， 通 过 优化 状态 分 配 来 节省 一 些 门 电路 并 不 重要 。 不 要 在 状态 分 配 上 浪费 太 多 时 间 。 
设计 时 间 远 远 比 节省 一 点 点 门 电路 要 重要 。 

表 14-6 给 出 了 交通 灯 控 制 器 FSM 的 一 种 可 能 的 二 进 制 状态 分 配方 法 。 这 个 特殊 的 状态 分 
配 用 格雷 码 进 行 编码 ， 从 而 在 每 次 状态 转换 时 状态 变量 只 有 一 位 发 生变 化 。 这 样 做 可 能 降低 功 
耗 ， 简 化 逻辑 。 一 般 我 们 可 能 更 容易 直接 选择 二 进 制 的 计数 值 (GEW =10, YEW=11), FÉ 
做 也 没有 太 大 差别 。 


表 14-5 ”交通 灯 控 制 器 FSM 的 独 热 码 状态 分 配 表 14-6 交通 灯 控 制 器 FSM 的 二 进 制 状态 分 配 





状 A 编 码 K 态 编 码 
GNS 0001 GNS 00 
YNS 0010 YNS 01 
GEW 0100 GEW 11 
YEW 1000 YEW 10 


14.5 实现 有 限 状 态 机 


给 定 状态 表 (或 状态 图 ) 和 状态 分 配 ，FSM 的 实现 将 简化 为 设计 两 个 组 合 逻 辑 电 路 ,一 
个 是 下 一 个 状态 ,一 个 是 输出 信号 。 这 些 组 合 逻 辑 电 路 包含 :位 宽 的 DD 触发 器 ， 用 于 在 时 钟 信 
号 上 升 沿 到 来 时 更 新 当前 状态 到 下 一 个 状态 。 像 这 样 的 多 位 D 触发 器 称 作 寄 存 器 ， 当 它 用 于 保 
存 FSM 的 状态 时 称 作 状 态 寄存 器 。 

使 用 独 热 码 进行 状态 分 配 ， 下 一 个 状态 逻辑 的 实现 就 是 将 状态 图 直接 转换 成 电路 图 ， 如 
图 14-10 显示 了 交通 灯 控 制 器 FSM。4 个 触发 器 对 应 4 种 状态 : GNS, YNS, GEW, YEW, ` 
第 一 个 触发 器 置 位 时 ，FSM 处 于 GNS 状态 。 逮 辑 电路 传输 每 个 触发 器 的 D 输入 信和 号 就 像 在 状 
态 图 中 转换 箭头 传输 相应 的 状态 。 对 于 状态 GEW 和 YEW 来 说 这 个 逻辑 电路 仅仅 是 一 条 信号 
线 。 这 两 个 状态 往往 紧 随 前 边 的 状态 出 现 。 对 于 YNS 状态 ， 输 入 逻辑 是 一 个 与 门 ， 将 之 前 的 
状态 (GNS) 和 GNS 状态 到 YNS 状态 的 转换 条 件 (carew) 相 与 。GNS 状态 是 两 个 目标 箭头 的 
目标 ， 因 此 需要 一 个 或 门 来 进行 组 合 。 首 先 ，GNS 状态 和 转换 条 件 carew 相 与 ， 该 与 门 的 输出 
信号 再 与 YEW 状态 的 一 条 信号 相 或 ，carew 对 应 从 GNS 到 其 自身 的 一 条 返回 边 。 





图 14-10 用 独 热 码 状 态 编码 实现 交通 灯 控 制 器 ESM。 用 了 4 个 触发 器 ， 每 个 触发 器 对 应 一 个 
状态 。 指 向 一 个 状态 的 状态 转换 箭头 直接 转换 成 前 面 所 述 的 相应 触发 器 的 逻辑 电 
路 。 图 上 方 的 输出 信号 代表 了 每 个 信号 灯 各 自 的 状态 。 例 如 ，lms 表示 南北 方向 的 


独 热 码 FSM 通常 可 以 用 这 种 方法 直接 实现 。 这 使 得 在 逻辑 综合 之 前 阶段 的 FSM 设计 和 维 
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护 变 得 非常 容易 。 只 要 能 够 简单 地 给 每 个 状态 实例 化 一 个 触发 器 ， 给 每 个 转换 箭头 选择 合适 的 
输入 门 电路 。 逻 辑 电路 功能 马上 就 呈现 出 来 了 。 能 够 直接 添加 、 删 除 或 变更 状态 转换 箭头 的 条 
件 ， 这 样 做 只 影响 跟 转 换 箭头 相关 的 部 分 逻辑 电路 。 但 是 ， 同 现代 逻辑 综合 的 方法 相 比 ， 这 种 
方法 的 优势 将 会 大 大 降低 。 

图 14-10 所 示 电 路 的 输出 逻辑 包含 两 个 或 非 门 。 状 态 GNS. YNS. GEW 和 YEW 直接 驱动 
绿灯 和 黄 灯 的 输出 。 而 红 灯 的 输出 通过 观察 每 个 方向 灯 的 点 亮 情况 ， 如 果 黄 灯 和 绿灯 熄灭 ， 则 
红 灯 点 亮 ， 即 r=7A 人 5。 

我 们 要 实现 二 进 制 状态 编码 的 FSM ， 需 要 对 每 一 个 状态 变量 进行 逻辑 综合 。 首 先 ， 我 们 将 
状态 表 转 换 成 真 值 表 ， 真 值 表 将 每 一 个 下 一 个 状态 变量 表示 为 当前 状态 变量 和 所 有 输入 信号 的 
函数 。 例 如 ， 交 通 灯 控制 器 FSM 使 用 表 14-6 所 示 的 状态 编码 ， 其 真 值 表 如 表 14-7 所 示 。 

表 14-7 ”交通 灯 控 制 器 FSM 使 用 表 14-6 所 示 方 法 进行 状态 分 配 之 后 ， 下 一 个 状态 函数 的 真 值 表 








状 态 carew 下 一 个 状态 说 明 状 #8 carew 下 一 个 状态 说 明 
00 0 00 绿灯 北 / 南 carew =0 1] 0 10 绿灯 东 / 西 carew =0 
00 1 01 绿灯 北 / 南 carew = 1 11 1 10 绿灯 东 / 西 carew = | 
01 0 11 黄 灯 北 / 南 carew =0 10 0 00 黄 灯 东 / 西 carew =0 
01 1 11 黄 灯 北 / 南 carew =1 10 1 00 HAT 东 / 西 carew = 1 
根据 该 状态 表 我 们 画 出 两 张 卡 诺 图 ， 如 7 a 
S150 











图 14-11 所 示 。 左 边 的 卡 诺 图 显示 了 下 一 个 状 。 X 
£ (ns) 的 MSB 的 真 值 表 ， 右 边 的 卡 诺 图 显 — Q 
示 了 下 一 个 状态 (ns,) 的 LSB 的 真 什 表 。 AB 
这 里 下 一 个 状态 逻辑 非常 简单 。ns, 函数 包含 ° 


01 11 10 





si 


一 个 质 蕴 涵 项 ， nso 函数 有 两 个 质 冀 涵 项 。 这 ns =S; nso= (So v Carew) A S, 
=P AAT AA E y J. uE HdE H a) A 图 14-11 根据 当前 状态 和 输入 信号 carew 计算 
NS, = So (14-1 ) 下 一 个 状态 (nsinso ) 的 卡 诺 图 


ns, = (so V carew) A s, (14-2) 
其 中 ns, . ns, 是 下 一 个 状态 变量 ，s, 、so 是 当前 状态 变量 。 
目前 我 们 已 经 知道 了 下 一 个 状态 函数 ， 剩 下 的 就 是 获得 输出 函数 。 为 此 我 们 写 出 输出 信号 
的 真 值 表 ， 这 只 是 当前 状态 的 函数 ， 如 表 14-8 所 示 。 输 出 变量 的 逻辑 函数 可 以 直接 从 此 真 值 
表 得 出 ， 具 体 如 下 : 


Bu = Si As (14-3) 
Yu = s A So (14-4) 
Fa = 54 (14-5) 
Bie = 8, VÑ Sh (14-6) 
y, =S X 85 (14-7) 


Fey = S; (14-8) 
结合 下 一 个 状态 和 逻辑 方程 ， 我 们 得 出 图 14-12 所 示 的 逻辑 电路 图 。 
表 14-8 交通 灯 控 制 器 FSM 使 用 表 14-6 所 示 方 法 进行 状态 分 配 之 后 ， 输 出 函数 的 真 值 表 








状 S 输 出 Kk 态 输 出 
00 100 001 11 001 100 
01 010 001 10 001 010 
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图 14-12 使 用 表 14-6 所 示 状 态 分 配 实现 交通 灯 控 制 器 FSM 的 逻辑 电路 图 


14.6 Verilog 编程 实现 有 限 状态 机 


指定 下 一 个 状态 和 输出 函数 ， 选 择 状态 分 配 ， 用 Verilog 语言 设计 一 个 FSM 将 是 一 件 简单 
的 事情 。 逻 辑 综合 完成 生成 下 一 个 状态 和 输出 逻辑 的 所 有 工作 。 图 14-13 给 出 了 交通 灯 控 制 器 
FSM 的 Verilog 语言 描述 。 逮 辑 的 主要 部 分 是 一 个 单独 的 case 语句 ， 用 来 定义 下 一 个 状态 和 输 
出 函数 。 

该 程序 由 三 个 关键 点 构成 。 

1) 实现 时 序 逻 辑 电路 时 ， 所 有 状态 变量 应 该 被 明确 定义 为 D 触发 器 。 不 要 让 Verilog 语言 
编译 器 为 你 推断 出 触发 器 。 在 此 程序 中 ， 状 态 触 发 器 直接 用 如 下 代码 进行 实例 化 : 

// 实例 化 状态 寄存 器 

DFF #('SWIDTH) state reg(clk, next, state) ; 


这 段 代 码 实例 化 一 个 ' SWIDTH 宽度 的 D 触发 器 ， 该 触发 器 由 时 钟 信号 clk 实现 ， 包 含 输 
和 人 信号 next ， 输 出 信和 号 state, 

2) 在 设计 有 限 状 态 机 时 ， 用 Verilog 语法 ' define 语句 定义 所 有 常量 。 不 要 对 任何 常量 
进行 硬 编码 。 应 该 用 这 种 方法 声明 的 常量 包括 状态 变量 的 宽度 ' SWIDTH， 状 态 编码 (如 
'GNS)， 输 入 信号 和 输出 编码 (如 'GNSL)。 尤 其 是 为 状态 编码 定义 符号 名 称 ， 这 样 编程 者 可 
以 通过 修改 定义 来 改变 状态 分 配 。 在 下 文中 我 们 将 介绍 一 个 这 样 的 例子 。 

3) 保证 在 程序 中 有 对 FSM 进行 复位 的 操作 。 在 这 里 我 们 定义 了 两 个 下 一 个 状态 变量 ， 
next1 和 next。case 语句 只 对 next1 作为 下 一 个 状态 进行 了 计算 ,而 忽略 了 复位 信号 rst. 
最 后 一 条 assign 语句 覆盖 了 这 种 情况 ， 如 果 rst 有 效 ， 则 下 一 个 状态 将 重 置 为 状态 'GNS。 

// 增加 复位 功能 


assign next = rst ? 'GNS : nextl ; 


在 下 一 个 状态 函数 之 外 考虑 复位 因素 ， 这 种 方式 很 大 程度 上 提高 了 程序 的 可 读 性 。 如 果 我 
们 不 这 样 做 ,就 得 在 每 个 状态 都 重复 复位 判断 ， 而 不 是 像 现 在 这 样 只 判断 一 次 。 

图 14-14 用 Verilog 语言 定义 了 交通 灯 控制 器 FSM。 用 ' define 的 方式 进行 定义 可 以 使 我 
们 在 程序 中 使 用 符号 名 称 ， 从 而 提高 可 读 性 ， 同 时 容易 修改 程序 。 例 如 ， 替 换 为 图 14-15 所 示 
的 独 热 码 状态 编码 ,我们 的 FSM 就 从 二 进 制 编码 转换 成 了 独 热 码 状 态 编码 ， 而 不 需要 更 改 任 
何其 他 代码 。 

DFF 模块 的 Verilog 语言 程序 如 图 14-16 所 示 。 该 行为 描述 用 always 语句 块 实现 : 

always @(posedge clk) 

out = in ; 
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该 程序 块 完成 在 每 次 时 钟 信号 clk 的 上 升 沿 (posedge) 到 来 时 将 输出 信号 更 新 为 out = in. 


// Traffic Light 

// 输入 : 

// ”clk 一 一 系统 时 钟 

// rst 一 一 复位 一 一 高 有 效 

// carew 一 一 东西 方向 来 车 一 一 当 东 西方 向 有 车 等 待 的 时 候 有 效 
// 输出 : 


// lights (6 位 ) {gns, yns, rns, gew, yew, rew} 
// 在 carew 无 效 时 保持 GNS 状 态 ，carew 有 效 时 ， 状 态 序列 依次 为 YNS，GEW，YEW 


module Traffic _Light(clk, rst, carew, lights) 
input clk ; 
input rst ; / 复位 
input carew ; // 东西 方向 马路 上 有 车 
output [5:0] lights ; // {gns, yns, rns, gew, yew, rew} 
wire [‘SWIDTH-1:0] state, next ; // 当前 状态 和 下 一 个 状态 
reg [`SWIDTH-1:0] nextl ; // 下 一 个 状态 W/o 复位 
reg [5:0] lights ; // 6 盖 灯 的 输出 ，1=on 


// 实例 化 状态 寄存 器 
DFF #(‘SWIDTH) state_reg(clk, next, state) ; 


// MAARRE T-ARA 3⁄8 iB fe oH EX 
always @(*) begin 
case (state) 
‘GNS: {next1l, lights} = {(carew ? ‘YNS : ‘GNS), ‘GNSL} ; 
‘YNS: {next1, lights} = ('GEW, ‘YNSL} ; 
‘GEW: {next1, lights} = {‘YEW, ‘GEWL} ; 
‘YEW: {next1, lights} = {'GNS, ‘YEWL} ; 
default: {next1l, lights} = {‘SWIDTH+6{1’bx}}; 
endcase 
end 
// 增加 复位 功能 
assign next = rst ? ‘GNS : nextl ; 
endmodule 





图 14-13 Verilog T Pi WË 2638 KT FE till a FSM 


‘define SWIDTH 2 
‘define GNS 2'b00 





图 14-14 Verilog 语言 定义 交通 灯 控 制 器 状态 变量 和 输出 编码 
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‘define YNS 2’b01 
‘define GEW 2’bil 
‘define YEW 2'b10 


‘define GNSL 6'b100001 
‘define YNSL 6'b010001 
‘define GEWL 6’b001100 
‘define YEWL 6’b001010 


图 14-14 (4%) 





‘define SWIDTH 4 

‘define GNS 4’b1000 
‘define YNS 4’b0100 
‘define GEW 4’b0010 
‘define YEW 4’b0001 


图 14-15 Verilog 语言 定义 交通 灯 控 制 器 FSM 的 独 热 码 状 态 编码 


交通 灯 控制 器 的 测试 平台 如 图 14-17 所 示 。 为 了 全 面 [module DERICIR in, out) ; 

测试 FSM， 我 们 的 测试 平台 需要 访问 到 状态 图 的 每 一 个 状 parameter n = 1; // 宽度 

! | £, 遍历 状态 图 中 的 每 一 条 边 。 对 于 我 们 的 交通 灯 控 制 器 | input clk ; 

305| FSM 来 说 ， 要 达到 这 个 覆盖 范围 不 是 特别 难 。 input [n-1:0] in ; 

测试 平台 由 三 部 分 构成 。 首 先 ， 实例 化 一 个 Traffic_ | output [n-1:0] out ; 
Light 模块 ， 即 测试 单元 。 第 二 个 组 成 部 分 是 一 个 ini- | reg In-1:0] out ; 
tial 模块 ， 产 生 时 钟 信号 并 输出 。 仿 真 结束 前 不 断 重复 
执行 forever 模块 体 。 在 这 种 情况 下 ， 重 复 的 代码 显示 | ”ge eg chk! 
一 些 变量 ， 并 产生 一 个 延迟 10 个 单位 时 间 的 时 钟 信号 。 Seas ee 
在 经 过 半 个 时 钟 周期 后 ，clk 信号 变 成 低 电 平 后 显示 结 
束 。 最 后 一 个 组 成 部 分 生成 测试 模块 的 输入 信号 。 图 14-16 Verilog 语言 描述 D 触发 器 
输入 信号 和 模块 做 出 的 响应 以 文本 的 方式 显示 在 图 14- 18 

中 , 该 文本 显示 了 在 每 次 时 钟 信号 下 降 沿 时 各 个 信号 的 状态 ， 相 应 的 波形 见 图 14-19。 最 
YJ, state 和 next 都 处 于 未 知 状态 (文本 中 输出 x， 在 波形 中 用 0 和 1 中 间 的 一 条 线 表 
示 ) 。 在 第 2 个 时 钟 周期 声明 信号 rst ， 复 位 到 一 个 已 知 状态 。 下 一 个 状态 信号 next 立 
即 响应 ，state 信号 紧 接 着 在 时 钟 上 升 沿 也 做 出 响应 。 在 第 5 个 时 钟 周期 carew 变 为 高 
电 平 之 前 ，FSM 一 直 保 持 状态 00， 在 第 6 个 时 钟 周期 FSM 转换 为 状态 01。 接 下 来 进行 一 
系列 状态 转换 ， 从 01、11、10， 最 后 在 第 9 个 时 钟 周期 返回 状态 00。 此 后 00 状态 保持 了 
两 个 周期 ， 直 到 carew 在 第 10 个 时 钟 周 期 变 为 高 电 平 ， 在 第 11 个 时 钟 周期 PSM 再 一 次 
启动 状态 转换 序列 。 这 次 carew 信和 号 保持 高 电 平 ， 一 直 重 复 这 些 状 态 序列 ， 直 到 仿真 
结束 。 





endmodule 
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module Test Fsml ; 
reg clk, rst, carew ; 
wire [5:0] lights ; 


Traffic Light tl(clk, rst, carew, lights) ; 


// 周期 为 10 个 时 间 单 元 
initial begin 
clk = 1 ; #5 clk = 
forever 
begin 
$display("sb %b tb %b", rst, carew, tl.state, lights ) ; 
#5 clk = 13 #5 clk = 0 ; 
end 


end 


// 输入 激励 

initial begin 
rst 0 ; carew=0 ; 启动 w/o 复位 ， 显 示 x 状 态 
#15 1 ; carew = 0 ; 复位 
#10 i 取消 复位 
#20 : 等 待 2 个 周期 后 有 车 到 达 
#30 ; 3 个 周期 后 车 离开 (绿灯 ) 
#20 ; 等 待 2 个 周期 后 车 辆 到 达 并 等 待 
#60 6 个 附加 周期 
$stop ; 

end 


endmodule 





图 14-17 ”交通 灯 控 制 器 FSM 的 Verilog 测试 平台 


XXXXXX 100001 
XXXXXX 100001 
100001 010001 
100001 001100 
100001 001010 
010001 100001 
001100 010001 
001010 


图 14-18 用 图 14-17 所 示 的 测试 平台 对 图 14-13 所 示 的 交通 灯 控 制 器 FSM 进行 仿真 的 结果 。 
每 行 显示 在 时 钟 下 降 沿 时 信号 rst, carew, state, linghts 的 值 
例 14-2 Verilong FSM 
用 Verilog 语言 为 例 14-1 中 的 脉冲 填充 器 FSM 编写 一 个 模块 。 
程序 如 图 14-20 所 示 。 程 序 中 实例 化 了 一 个 状态 寄存 器 sr, casex 语句 用 最 直接 的 方法 
对 状态 表 进 行 编码 。 状 态 分 配 用 宏 指 令 实 现 。 为 了 增强 程序 的 可 读 性 ， 密 指令 'O、'I、' 双 分 


or FF FS O oS O 


0 
1 
0 
0 
0 
0 
0 
0 
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/Test_Fsm1/clk 

(Test_Fsm1/rst 
‘Test_Fsm1/carew 
/Test_Fsm1/ti/next 


Qi 
/Test_Fsm1/tvstate — L p to pe pti 
Se e. 
/[Test_Fsm1/tlights 





图 14-19 14-13 所 示 的 交通 灯 控 制 器 FSM 在 图 14-17 所 示 的 测试 平台 进行 仿真 的 波形 图 
别 定义 为 一 位 数据 表示 的 0、1 


module PulseFiller(clk, rst, a, q) ; 
input clk, rst, a ; 
output q ; 
wire [‘SWIDTH-1:0] state ; 
reg [‘SWIDTH-1:0] next ; 
reg q ; 


DFF #('SWIDTH) sr(clk, next, state) ; 


always @(*) begin 
casex((rst,a,state)) 
(`r x, ‘SX}: {q,next} 
(`o, O, "sR}: {q,next} = 
, SR): {q,next} 
‘O, X, "SL}: {q,next} 
,'S2}: (q next) 
,AS3): {q,next} 
,`S4}: {q,next} 
‘I,'S4}: {q,next} 
`O, 'S5): {q,next} 
‘I, `S5}: {q,next} 
,'0O, ‘SM}: {q,next} 
‘O,‘I,‘SM}: {q,next} 
“O; °X, SE): (gq. next) 
default: {q,next} = Í` 
endcase 
end 
endmodule 





图 14-20 用 Verilog 语言 实现 例 14-2 介绍 的 脉冲 填充 器 FSM 


小 结 

在 本 章 中 ,已 经 增加 了 数字 系统 学 习 中 的 时 间 维 度 。 通 过 在 组 合 逻 辑 电路 中 添加 反馈 回 
路 ， 我 们 搭建 了 时 序 逻 辑 电路 : 时 序 逻 辑 电 路 的 输出 信号 不 止 是 输入 信号 的 函数 ， 还 是 当前 状 
态 以 及 它们 的 历史 状态 的 函数 。 组 合 逻辑 电路 是 静态 的 ， 通 常 在 组 合 逻 辑 电路 中 给 定 相同 的 输 
入 会 产生 相同 的 输出 结果 ， 而 时 序 逻 辑 电路 的 行为 是 随时 间 不 断 发 展 的 。 

为 了 控制 状态 变量 之 间 潜在 的 竞争 ， 同 步 时 序 逻 辑 电 路 在 所 有 的 反馈 回路 中 包含 了 一 个 时 
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钟 控制 的 触发 器 或 寄存 器 。 这 样 做 使 得 所 有 状态 变量 都 在 时 钟 信号 的 上 升 治 同时 进行 变更 。 同 
步 时 序 逻 辑 电路 的 状态 演变 以 不 连续 的 步骤 进行 。 每 个 时 钟 周期 ， 在 时 钟 信 号 上 升 沿 到 来 时 ， 
状态 变更 到 一 个 由 先前 状态 和 输入 信和 号 计算 出 来 的 状态 值 。 同 步 时 序 凶 和 辑 电路 这 种 步 进 式 的 行 
为 方式 使 得 它 的 分 析 和 设计 变 得 很 简单 。 

设计 一 个 同步 时 序 逻 辑 电 路 或 有 限 状态 机 ， 要 从 描述 状态 机 函数 的 状态 图 或 状态 表 开 始 。 
状态 分 配 为 状态 机 的 每 个 状态 分 配 了 唯一 的 位 模式 。 用 本 书 前 边 介 绍 的 方法 ， 我 们 可 以 根据 状 
态 编码 、 状 态 图 或 状态 表 写 出 下 一 个 状态 和 输出 信号 的 组 合 逻辑 函数 。 

用 Verilog 语言 实现 有 限 状态 机 ， 需 要 明确 实例 化 一 个 状态 和 寄存器， 然后 用 case 语句 或 
assign 语句 设计 组 合 逻辑 电路 来 计算 下 一 个 状态 和 输出 信号 。 在 设计 过 程 中 要 保证 状态 寄存 
顺 在 复位 时 能 够 初始 化 到 一 个 已 知 状态 。 


文献 说 明 


FSM 的 最 早 描述 之 一 以 及 时 序 逻 辑 参考 赫 夫 曼 的 “时 序 开 关 电 路 的 综合 ” [51 ] Moore 
[80] 和 Mealy [76] 关于 时 序 PSM 的 论文 也 提供 了 该 主题 的 背景 。 关 于 FSM 最 新 的 研究 ， 参 
考 文献 [65] 提 到 了 Kohavi 的 著作 。 许 多 原著 探索 了 合成 状态 机 逻辑 问题 ， 诸 如 Brown 的 
(Fundamentals of Digital Logic) [19]. 

对 交通 灯 的 深入 探讨 感 兴趣 的 读者 可 以 阅读 1927 年 的 两 篇 文章 [68，73] ， 这 两 篇 文章 介 
绍 了 现在 无 处 不 在 的 交通 灯 的 使 用 。 


习题 

14.1 归 位 序列 ，I。 表 14-2 所 描述 的 有 限 状 态 机 没有 复位 输入 。 说 明 不 考虑 初始 化 启动 状态 ， 通 过 提 
供 一 个 固定 的 输入 信号 序列 ， 如 何 能 够 使 状态 机 处 于 已 知 状态 ” 通常 用 于 使 FSM 回 到 同一 个 状态 
的 输入 序列 称 为 归 位 序列 。 

14.2 归 位 序列 ， 卫 。 假 设 表 14-4 描述 的 交通 灯 控 制 器 FSM 没有 复位 到 状态 GNS。 给 出 一 个 归 位 序列 ， 
使 状态 机 能 够 回 到 GNS 状态 。 

14.3 改进 的 交通 灯 控 制 器 ，LI。 修 改 表 14-4 描述 的 交通 灯 控 制 器 FSM， 使 信号 灯 在 变 为 绿灯 之 前 ， 每 
个 方向 的 信号 灯 都 保持 一 个 周期 的 红 灯 。 给 出 修改 后 的 FSM 的 状态 表 和 状态 图 。 

14.4 改进 的 交通 灯 控 制 器 ，I-I。 给 习题 14.3 中 改进 的 交通 灯 控 制 器 选择 一 种 状态 分 配 ， 推 导出 逻辑 
函数 计算 下 一 个 状态 和 输出 信号 的 值 。 给 出 下 一 个 状态 变量 和 输出 变量 的 卡 诺 图 ， 并 给 出 FSM 的 
门 级 电路 的 原理 图 。 

14.5 改进 的 交通 灯 控 制 器 ，L-II。 编 写 Verilog 程序 ， 实 现 习题 14. 3 的 状态 机 ， 并 进行 验证 。 

14.6 改进 的 交通 灯 控 制 器 ，II-I。 修 改 表 14-4 描述 的 交通 灯 控 制 器 FSM， 增 加 一 个 输入 信号 carns， 指 
示 在 南北 方向 有 车 等 待 。 修 改 逻 辑 关系 ， 当 信号 灯 变 为 东西 方向 通行 时 ， 东 西方 向 一 直 保持 绿灯 
亮 ， 直 到 南北 方向 检测 到 有 车 出 现 。 给 出 修改 后 的 FSM 的 状态 表 和 状态 图 。 

14.7 改进 的 交通 灯 控 制 器 ，IL-I。 给 习题 14.6 中 改进 的 交通 灯 控 制 器 选择 一 种 状态 分 配 ， 推 导出 逻辑 
函数 计算 下 一 个 状态 和 输出 信号 的 值 。 给 出 下 一 个 状态 变量 和 输出 变量 的 卡 诺 图 ， 并 给 出 FSM 的 
门 级 电路 的 原理 图 。 

14.8 改进 的 交通 灯 控 制 器 ，IL-II。 编 写 Verilog 程序 ， 实 现 习 题 14.6 的 状态 机 ， 并 进行 验证 。 

14.9 改进 的 交通 灯 控 制 器 ，IILI。 修 改 表 14-4 描述 的 交通 灯 控 制 器 FSM， 只 要 carew 为 高 电 平 FSM 就 
一 直 保持 状态 GEW。 给 出 修改 后 的 FSM 的 状态 表 和 状态 图 。 

14.10 改进 的 交通 灯 控 制 器 ，IIL-I。 给 习题 14.9 中 改进 的 交通 灯 控 制 器 选择 一 种 状态 分 配 ， 推 导出 逻 
辑 函 数 计算 下 一 个 状态 和 输出 信号 的 值 。 给 出 下 一 个 状态 变量 和 输出 变量 的 卡 诺 图 ， 并 给 出 FSM 
的 门 级 电路 的 原理 图 。 

14.11 改进 的 交通 灯 控 制 器 ，IIL-II。 编 写 Verilog 程序 ， 实 现 习题 14.9 的 状态 机 ， 并 进行 验证 。 
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改进 的 脉冲 填充 器 ， 工 。 修 改 例 14-1 中 的 ESM， 使 得 输入 信号 a 在 每 6 个 周期 预期 出 现 一 次 正 
脉冲 ， 而 不 是 之 前 的 5 个 周期 。 画 出 改进 的 FSM 的 状态 图 。 

脉冲 填充 器 状态 表 。 写 出 例 14-1 中 PSM 的 状态 表 。 

脉冲 填充 器 状态 分 配 。 用 三 个 状态 变量 为 例 14-1 的 脉冲 填充 器 FSM 设计 状态 分 配 。R 状态 编码 
为 000， 状 态 1 编码 为 001。 对 剩 下 的 状态 进行 分 配 ， 使 得 每 次 状态 转换 时 变更 尽 可 能 少 的 状 
态 位 。 

实现 脉冲 填充 器 。 写 出 例 14-1 中 脉冲 填充 器 的 下 一 个 状态 的 逻辑 方程 式 。 使 用 以 下 状态 编码 : R= 
000, 1=001, 2=010, 3=011, 4=100, 5=101, M=110, L=111, 

独 热 码 实现 脉冲 填充 器 。 用 独 热 码 状态 分 配 ， 实 现 例 14-1 中 的 脉冲 填充 器 FSM， 夯 出 原理 图 。 
实现 FSM。 使 用 状态 编码 GNS =00，YNS =01，GEW =10, YEW =11， 实 现 交 通 灯 控制 器 FSM. 
给 出 下 一 个 状态 变量 和 输出 变量 的 卡 诺 图 ， 并 给 出 FSM 的 门 级 电路 的 原理 图 。 

数字 锁 ， 工 。 画 出 数字 锁 的 状态 图 和 状态 表 。 数 字 锁 有 两 个 输入 信号 a 和 4&4， 一 个 输出 信和 号 un- 
lock。 只 有 检测 到 a、2、a、a 输入 序列 时 输出 信号 才 有 效 。 输 入 序列 的 每 个 信号 必须 持续 一 个 或 
多 个 周期 ， 并 且 所 有 输入 信号 在 一 个 或 多 个 周期 内 保持 低 电 平 。 解 锁 之 后 ， 任 何 一 个 输入 信和 号 变 
为 高 电 平 都 会 使 输出 信号 变 低 。 

KFM, H. H Verilog 语言 编程 实现 习题 14. 18 的 数字 锁 状 态 机 。 

基本 的 自动 售 货 机 ， 工 。 习 题 14. 20 ~ 习题 14. 22 将 集中 于 为 简单 的 自动 售 货 机 设计 一 个 FSM。 
该 自动 售 货 机 只 出 售 0. 4 美元 的 单一 商品 ， 并 且 只 接受 5 美 分 硬币 和 10 美 分 硬币 。 输 入 信号 为 
nickel 和 dime， 输 出 信号 为 vend 和 change。 当 向 售 货 机 投入 5 美 分 硬币 (0.05 美元 ) Be 10 美 分 
硬币 (0.10 美元 ) 时 ， 两 个 输入 信号 出 现 正 脉 串 (一 次 只 有 一 个 输入 信号 出 现 正 脉冲 )。 当 投入 
足够 的 钱 之 后 ，vend 信号 出 现 一 个 周期 的 高 电 平 。 如 果 投 入 了 0.45 美元 ，change 信号 也 出 现 一 
个 周期 的 高 电 平 。 卖 出 一 件 商品 之 后 ， 售 货机 重新 回 到 没有 投入 硬币 时 的 初始 化 状态 。 我 们 将 在 
16.3.1 节 开 发 一 个 更 加 灵活 的 自动 售 货 机 。 画 出 该 自动 售 货 机 的 状态 图 和 状态 表 。 

基本 的 自动 售 货 机 ， 开 。 使 用 习题 14. 20 完成 的 状态 图 ， 用 二 进 制 状态 分 配 ， 推 导出 输出 信号 和 
下 一 个 状态 逻辑 。 

基本 的 自动 售 货 机 ， 焉 。 用 Verilog 编程 实现 习题 14. 20 中 的 自动 售 货 机 。 给 出 用 户 连续 投入 2 个 
5 美 分 硬币 、6 个 10 美 分 硬币 、3 个 5 美 分 硬币 之 后 输出 信号 和 状态 的 波形 图 。 

能 够 投入 25 美 分 硬币 的 自动 售 货 机 ， 工 。 修 改 习题 14. 20 的 自动 售 货 机 ， 添 加 25 美 分 硬币 输入 
(0.25 美元 ) ， 修 改 状 态 表 和 状态 图 。 假 设 当 change 为 高 电 平时 ， 自 动 售 货 机 在 每 个 周期 都 输出 
一 枚 5 美 分 硬币 。 

能 够 投入 25 APMP HH BADE, H. BM Verilog 语言 程序 ， 实 现 习 题 14.23 的 状态 机 。 
飞机 指示 灯 ， 工 。 为 商务 班机 控制 座位 安全 带 和 禁用 电子 产品 标志 的 FSM 画 出 状态 图 和 状态 表 。 
状态 机 有 三 个 输入 信号 : alt10k，alt25k，smooth。 当 飞机 在 任何 方向 运动 超过 10 000 (25 000) 
英尺 时 ，altl0k (alt25k) 将 出 现 正 脉冲 并 保持 一 个 周期 的 高 电 平 。 如 果 飞 机 没有 上 升 、 下 降 或 经 
FR, (ë smooth 将 设置 为 高 电 平 。 当 飞机 高 度 低 于 10 000 英尺 的 时 候 ， 状 态 机 应 该 将 信号 
noelectronics 设置 为 高 电 平 ， 反 之 设置 为 低 电 平 。 当 飞机 高 于 25 000 英尺 并 且 信 和 号 smooth 至 少 保 
持 了 5 个 周期 的 有 效 状态 ， 只 有 这 时 候 信 号 seatbelt 才 应 该 为 低 电 平 。 假 设 飞 机 初始 化 状态 在 地 
面 上 。 

飞机 指示 灯 ， 开 。 用 独 热 码 状态 编码 ， 为 习题 14. 25 的 状态 机 推导 计算 出 下 一 个 状态 和 输出 信号 
的 电路 逻辑 。 

飞机 指示 灯 ， 亚 。 编 写 Verilog 语言 程序 ， 实 现 习题 14. 25 的 状态 机 。 

防 抱 死 制 动 ， 工 。 防 抱 死 制 动 系统 的 FSM 接受 两 个 输入 信和 号 (wheel 和 time) ， 生 成 一 个 输出 信 
号 〈unlock) 。 车 轮 每 旋转 几 圈 后 信号 wheel 输入 一 个 正 脉冲 保持 一 个 时 钟 周期 的 高 电 平 。 信 和 号 
time 每 10 ms 输入 一 个 正 脉冲 保持 一 个 时 钟 周期 的 高 电 平 。 如 果 机 器 在 最 后 一 个 wheel 脉冲 之 后 
检测 到 两 个 time 脉冲 ， 则 机 器 认为 轮子 出 现 抱 死 现象 ， 信 号 unlock 保持 一 个 时 钟 周期 的 有 效 状 
态 来 “ 泵 送 ” 制 动 系统 。 信 号 unlock 变 为 高 电 平 之 后 ， 机 器 在 重新 开始 正常 操作 之 前 等 待 两 个 
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time 脉冲 。 因 此 ， 在 两 个 unlock 脉冲 之 间 至 少 有 4 个 time 脉冲 。 画 出 此 状态 机 的 状态 图 (遵循 
冒 泡 规则 ) 。 

14.29 BRAHA, Mo W Verilog 语言 程序 ， 实 现 习题 14. 28 的 防 抱 死 制 动 状态 机 ， 并 进行 验证 。 

14.30 方向 传感器 ， 工 。 方 向 传感器 用 来 检测 旋转 的 齿轮 。 每 次 当 齿 轮 齿 超过 传感器 左边 界 或 右边 界 时 
输入 一 个 脉冲 信号 。 该 状态 机 有 两 个 输入 信号 让 和 让， 两 个 输出 信号 ol 和 or。 任 何 时 候 ， 输 入 信 
号 让 出 现 一 个 或 多 个 周期 的 高 电 平 ， 零 个 周期 或 多 个 周期 之 后 ， 紧 接着 输入 信号 出 现 零 个 周期 
或 者 多 个 周期 的 高 电 平 ， 这 时 FSM 应 该 在 ol 端 输 出 一 个 单 周期 脉冲 。 同 样 ， 如 果 ir 出 现 高 电 平 ， 
紧 接着 让 出 现 高 电 平 ， 则 在 or 端 输出 一 个 单 周期 脉冲 。 在 图 14-21 中 我 们 给 出 了 一 个 波形 实例 。 
画 出 状态 图 和 状态 表 。 i 





图 14-21 习题 14.30 中 方向 传感器 的 时 序 图 实例 312 
14.31 方向 传感器 ， 工 。 编 写 Verilog 语言 程序 ， 实 现 习 题 14. 30 的 方向 传感器 状态 机 ， 并 进行 验证 。 313 
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FSM 可 以 运行 多 快 ? 会 由 于 逻辑 太 快 而 导致 FSM 失败 吗 ? 在 这 一 章 中 ， 我 们 将 通过 分 析 
有 限 状 态 机 和 构成 有 限 状 态 机 的 触发 器 的 时 序 来 回答 这 些 问 题 。 

有 限 状 态 机 受制 于 两 个 时 序 约束 一 一 最 大 延迟 约束 和 最 小 延迟 约束 。 我 们 可 以 操作 FSM 
的 最 大 速度 取决 于 两 个 触发 器 参数 (建立 时 间 和 传播 延迟 ) 以 及 下 一 个 状态 逻辑 的 传播 延迟 。 
另 一 方面 ， 最 小 延迟 约束 取决 于 另 两 个 触发 器 参数 (保持 时 间 和 污染 延迟 ) 以 及 下 一 个 状态 
逻辑 的 最 小 污染 延迟 。 我 们 将 看 到 如 果 最 小 延迟 约束 不 满足 ， 由 于 违反 了 保持 时 间 规 则 ， 我 们 
的 FSM 可 能 在 任何 时 钟 速度 下 都 不 能 运行 。 时 钟 偏差 ， 即 到 达 不 同 触发 器 的 时 钟 延 迟 ， 对 最 
大 延迟 约束 和 最 小 延迟 约束 都 有 影响 。 


15.1 传播 和 污染 延迟 

在 同步 系统 中 ,逻辑 信号 从 一 个 时 钟 周期 末 的 稳定 状态 演变 为 下 一 个 时 钟 周期 末 的 新 的 稳 
定 状态 。 在 这 两 个 稳定 状态 之 间 ， 状 态 可 以 发 生 任意 次 数 的 转换 。 

在 分 析 逻 辑 模 块 的 时 序 时 ， 我 们 关心 两 个 时 间 。 首 先 ， 我 们 想 知 道 输入 信号 首次 变化 后 
(在 新 的 时 钟 周 期 )， 输 出 信号 能 够 保持 多 长 时 间 的 初始 化 稳定 状态 (从 最 后 一 个 时 钟 周 期 开 
始 )。 我 们 称 这 个 时 间 为 电路 的 污染 延迟 ， 即 电路 保持 的 旧 的 稳定 状态 被 输入 转换 污染 所 需 的 
时 间 。 注 意 输出 值 的 第 一 次 改变 一 般 不 改变 输出 信号 到 新 的 稳定 状态 。 我 们 想 知 道 的 第 二 个 时 
间 是 ， 当 输入 信号 停止 变化 后 多 长 时 间 输 出 信号 能 够 到 达 新 的 稳定 状态 。 我 们 称 这 个 时 间 为 传 
播 延迟 ， 即 输入 信号 的 稳定 值 传播 到 输出 信号 的 稳定 值 所 需 的 时 间 。 

传播 延迟 和 污染 延迟 如 图 15-1 所 示 。 图 15-1a 给 出 了 一 个 组 合 逻 辑 电路 模块 ， 其 输入 信和 号 
为 a， 输 出 信号 为 5。 图 15-1b 显示 了 当 输 入 信号 a 改变 状态 时 输出 信号 如 何 响应 。 在 时刻 
之 前 ， 从 最 后 一 个 时 钟 周期 开始 ， 输 入 信号 a 和 输出 信号 b 都 处 于 稳定 状态 。 在 4 时刻， 输入 
信号 a 首先 发 生 改 变 。 如 果 信 号 a 是 一 个 多 位 信号 ， 这 个 时 刻 指 的 是 输入 信号 a 第 一 位 改变 状 
态 的 时 间 ， 其 他 位 的 状态 可 以 随后 再 改变 。 不 管 是 单一 位 还 是 多 位 ，t, 时 刻 就 是 输入 信号 a 发 
生 第 一 次 状态 转换 的 时 间 。 信 号 a 的 给 定位 在 达到 新 的 稳定 状态 之 前 可 能 发 生 了 多 次 变换 。 在 
t JZ, BB: 时 刻 之 后 经 历 一 段 污染 延迟 1。,， 信 号 a 的 首次 变化 可 能 影响 输出 信号 b, (ë= b 
可 能 改变 状态 。 在 t, 时 刻 之 前 ， 信 号 5 保持 时 钟 周期 稳 态 值 。 随 着 信号 a ZE t, 时 刻 开始 发 生变 
化 ， 信 号 5 第 一 个 发 生变 化 的 位 在 时 刻 开始 变化 ， 此 后 该 位 在 信号 b 到 达 稳 定 状态 之 前 可 能 
会 再 次 变化 ， 信 号 b 的 其 他 位 随后 发 生变 化 。 

L É É N 


a) b) 
图 15-1 传播 延迟 fw 和 污染 延迟 kw。 逻辑 电路 模块 的 污染 延迟 指 的 是 第 一 个 输入 信和 号 第 一 次 
发 生变 化 到 第 一 个 输出 信和 号 第 一 次 发 生变 化 之 间 的 时 间 。 逻 辑 电 路 模块 的 传播 延迟 指 
的 是 最 后 一 个 输入 信号 最 后 一 次 发 生变 化 到 最 后 一 个 输出 信号 最 后 一 次 发 生变 化 之 间 
的 时 间 


#I5 HAW R 227 


在 时刻， 输入 信号 a 停止 变化 状态 。 从 时 刻 开 始 ， 至 少 到 当前 时 钟 周期 结束 前 ， 信 号 
a 保持 稳定 状态 。ts 时 刻 表示 信号 a 的 最 后 变化 位 完成 最 后 一 次 状态 切换 。 在 4 时 刻 ， 即 4s 时刻 
之 后 经 历 一 段 传播 延迟 tw ， 输 入 信号 a 最 后 的 变化 对 输出 信号 产生 最 后 的 影响 。 从 这 一 点 
开始 ， 至 少 到 时 钟 周期 结束 之 前 ， 输 出 信号 2 在 此 时 钟 周期 保持 稳定 状态 。 

我 们 用 tas G.) 来 表示 从 信号 a 到 信号 的 传播 (污染 ) 延迟 。 下 标 d 或 表示 传播 或 
污染 。 下 标的 其 他 位 给 出 了 延迟 的 源 信 号 和 目标 信号 。 就 是 说 ,i 表示 从 信号 * 转变 开始 到 信 
号 y 转变 的 延迟 。 

像 5.1 节 介 绍 的 那样 ， 我 们 从 输入 信和 号 的 信号 摆 幅 50% 的 交叉 点 开始 到 输出 信号 的 信号 摆 
幅 50% 的 交叉 点 结束 来 对 延迟 进行 测量 。 用 这 种 方法 测量 延迟 使 我 们 可 以 用 线性 路 径 的 方式 
对 传播 延迟 和 污染 延迟 进行 求 和 ， 如 图 15-2 所 示 。 图 中 的 时 序 图 显示 了 当 两 个 模块 线性 组 合 
时 ， 它 们 的 延迟 求 和 为 : 


ba = ty + ty. (BAR 一 一 译 者 注 ) (15-1) 
banc = bags + bye (JR BAR — BFE) (15-2) 
a! 
š 
boas — faab— 
a b c 一- 
kaa = hac 
c | a Se ORL, 
tea 
a) b) 


图 15-2 ”线性 路 径 下 传播 延迟 和 污染 延迟 的 求 和 。a) 两 个 电路 模块 通过 输入 信号 a、 中 间 信 
号 5、 输出 信号 串联 。b) 时 序 图 显示 了 污染 延迟 teac = teab + tobe» TPR AS SHR HEIR 


tdac = bdab + babe 


用 并 行路 径 处 理 电 路 问题 ， 我 们 只 简单 列 出 所 有 可 能 的 单一 位 数 路 径 。 总 体 污染 延迟 是 所 
有 路 径 的 最 小 污染 延迟 ， 总 体 传播 延迟 是 所 有 路 径 的 最 大 传播 延迟 。 

图 15-3a 给 出 了 一 个 具有 静态 冒险 的 电路 〈 回 顾 6. 10 节 ) 。 每 个 门 电路 符号 内 的 值 是 以 任 
意 时 间 单 位 表示 的 该 门 电路 的 延迟 值 。( 在 这 里 我 们 假设 基本 门 电路 的 污染 延迟 和 传播 延迟 是 
相同 的 。) 图 15-3b 中 显示 的 时 序 图 说 明了 当 信 号 a 下降 ,信号 68=1 并 且 信 号 c=0 时 的 时 序 。 
输出 信号 在 两 个 时 间 单 位 后 第 一 次 发 生变 化 ,4 个 时 间 单 位 后 最 后 一 次 发 生变 化 。 因 此 ,1 = 


2, bays =4。 





: i 
g þa- Laf 
i— fay i 


a) b) 
Pe] 15-3 有 冒险 现象 的 电路 举例 说 明 传 播 和 污染 延迟 
我 们 可 以 通过 列举 路 径 得 到 同样 的 结果 。 最 小 延迟 路 径 为 w-d -/， 其 污染 延迟 为 2; 最 


大 延迟 路 径 为 a-e -f， 其 传播 延迟 为 4。 
污染 延迟 和 传播 延迟 独立 于 电路 的 输入 状态 。 图 15-3a 中 的 电路 ,不 管 信号 5 和 < 的 状态 
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是 什么 ， 从 a 到 了 的 污染 延迟 都 为 2。 该 延迟 表示 在 输入 信号 a 发 生变 化 后 两 个 时 间 单 位 以 后 
输出 信号 可 能 会 发 生变 化 ， 但 不 保证 一 定 会 变 。 

许多 人 对 污染 延迟 和 最 小 传播 延迟 混淆 不 清 。 这 两 个 延迟 不 是 一 回 事 。 最 小 传播 延迟 是 电 
路 的 输入 信号 转换 之 后 ， 电 路 输出 端 出 现 正确 的 稳定 状态 所 需 时 间 的 最 小 值 (在 一 定 参 数 范围 
内 : 电压 、 温 度 、 过 程 变量 、 输 入 信号 组 合 )。 相 比 之 下 ， 污 染 延 迟 指 的 是 电路 的 输入 信号 转 
换 之 后 ， 电 路 输出 端 最 早 开始 从 之 前 的 稳定 状态 值 发 生变 化 的 时 间 。 这 些 不 是 一 回 事 。 导 致 污 
染 延 迟 的 转换 过 程 通 常 不 会 引起 输出 信号 变化 到 稳定 状态 ， 而 是 引发 输出 信号 变化 到 一 些 中 间 
值 一 一 例如 ， 图 15-3 中 冒险 电路 输入 信号 a 从 1 切换 为 0 的 过 程 。 
例 15-1 传播 延迟 和 污染 延迟 

在 图 15-4 所 示 的 电路 中 ,计算 从 输入 信号 a 到 输出 信号 g 的 传播 延迟 和 污染 延迟 。 每 个 这 
辑 门 上 标 出 的 数字 以 皮 秒 为 单位 表示 了 该 门 的 延迟 。 





图 15-4 例 15-1 中 的 延迟 计算 电路 


最 小 延迟 为 从 a 直接 到 或 非 门 再 到 9g HBB, Ash, 1, =25 ps。 最 大 延迟 包括 两 个 反 相 器 
和 与 非 门 ， 给 出 延迟 为 liw =65 ps. 


15.2 D 触发 器 


时 序 约束 决定 了 FSM 是否 进 行 操作 ， 以 什么 速度 进行 操作 取决 于 构成 FSM 的 时 钟 存储 元 
fF, 我们 给 出 的 例子 中 用 的 D 触发 器 。D 触发 器 的 示意 图 如 图 15-5 所 示 。 多 位 的 D 触发 器 一 
AMET AS. TEX BRAG D 触发 器 看 作 黑 金子 ， 只 关心 它 的 外 部 行为 ， 而 不 管 这 些 行 为 在 
触发 器 内 部 是 如 何 完成 的 。 我 们 将 推迟 到 第 27 章 对 D 触发 咒 内 部 进行 探索 。 

D 触发 器 在 时 钟 信 号 上 升 沿 对 输入 信号 进行 取样 ， 并 根据 所 取 的 样本 值 对 输出 信号 进行 更 
新 。 该 取样 过 程 和 更 新 过 程 在 图 15-5b 所 示 的 时 序 图 中 有 所 描述 。 为 了 保证 能 够 正确 取样 ， 输 
入 数据 〈 显 示 在 时 序 图 顶部 的 波形 中 ) 在 时 钟 信号 上 升 沿 前 后 必须 保持 一 段 时 间 的 稳定 状态 。 
特别 注意 在 时 钟 信号 上 升 沿 到 达 50% 点 之 前 数据 必须 已 经 到 达 其 正确 值 (在 图 中 用 x 表示 ) 
并 保持 了 建立 时 间 t. 的 时 间 长 度 ; 在 时 钟 信号 50% 点 之 后 ， 数 据 必须 继续 保持 稳定 值 ， 直 到 
经 过 保持 时 间 (hold time) t, 之 后 。 在 数据 波形 图 的 灰色 区 域 ， 输 入 信号 d 可 以 为 任意 值 。 然 
而 ， 在 设置 和 保持 区 间 内 d 必须 保持 稳定 状态 ， 以 保证 触发 器 能 够 正确 得 到 取样 值 x。 

如 果 输 入 信号 满足 设置 和 保持 时 间 约 束 ， 触 发 器 将 根据 取样 值 x 对 输出 信号 进行 更 新 ， 如 
图 15-5b 中 底部 波形 所 示 。 在 时 钟 信 号 上 升 沿 之 后 的 污染 延迟 keo 时 间 内 ， 输 出 端 9 仍然 稳定 
输出 其 原 值 〈 即 前 一 个 时 钟 信号 上 升 沿 所 取 的 样品 值 ) 。 电 路 在 这 个 时 间 点 之 前 可 能 仍然 依赖 
于 旧 的 稳定 的 输出 值 。 污 染 延 迟 之 后 触发 器 的 输出 信号 可 能 发 生变 化 ,但 是 可 能 不 是 正确 的 
值 。 这 段 时 间 没 有 保障 的 输出 信号 在 图 中 表示 为 灰色 阴影 。 时 钟 信号 上 升 沿 之 后 经 过 传播 延迟 
tico， 输 出 信号 确保 已 经 变 为 从 输入 信号 取样 的 x 值 。 在 出 现下 一 个 时 钟 信号 上 升 沿 之 前 以 及 
上 升 沿 之 后 的 keo 时 间 内 ， 输 出 信和 号 都 将 稳定 地 保持 这 个 值 。 


O 注意 1 或 4, 可 能 是 负数 ,但 是 1. +4, 一 般 是 正 数 。 
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图 15-5 D 触发 器 。a) 原理 符号 图 ; b) 时 序 图 。D 触发 器 在 时 钟 信 号 上 升 沿 对 输入 信号 进 
行 取样 ， 并 根据 取样 结果 对 输出 信和 号 进行 更 新 。 为 了 正确 取样 ， 输 入 信和 号 必须 在 时 
钟 信号 上 升 沿 之 前 点 时 间 内 直到 时 钟 信号 上 升 沿 之 后 th 时 间 都 保持 稳定 。 输 出 信 
号 可 能 在 时 钟 信号 之 后 ko 时间 后 马上 发 生变 化 。 输 出 信号 到 达 正 确 值 的 时 间 不 晚 





15.3 设置 和 保持 时 序 约束 

目前 我 们 已 经 介绍 了 相关 术语 ， 有 限 状 态 机 的 时 序 约 束 很 简单 。 为 了 确保 时 钟 周期 人 ,对 于 

最 长 路 径 来 说 满足 D 触发 器 的 建立 时 间 也 足够 长 ， 必 须 满足 以 下 条 件 : 
bey Z taco + bam + t, (15-3) 
其 中 ，iaws 指 的 是 从 D 触发 器 输出 端 到 D 触发 器 输入 端的 最 大 传播 延迟 。 

我 们 还 要 保证 没有 信和 号 污染 的 延迟 时 间 太 短 导 致 违背 D 触发 器 输入 信号 的 保持 时 间 约 束 ， 

为 此 需要 满足 条 件 : 
by eg + Dana (15-4) 
其 中 ， tw, 指 的 是 从 DD 触发 器 输出 端 到 D 触发 器 输入 端的 最 小 污染 延迟 。 

这 两 个 约束 条 件 (15-3) 和 (15-4) 控制 系统 时 序 。 建 立时 间 约 束 (15-3) 通过 给 定 电路 
运行 的 最 小 周期 时 间 i 决定 了 电路 的 性 能 。 另 一 方面 ,保持 时 间 约 束 是 正确 性 约束 。 如 果 违 反 
了 方程 式 〈15-4) ， 电 路 就 不 满足 它 的 保持 时 间 约 束 ， 不 管 时 钟 周期 时 间 为 多 少 ， 电 路 都 可 能 
出 现 故 障 。 

15-6 给 出 了 一 个 简单 的 有 限 状 态 机 ， 我 们 将 用 它 来 说 明 建立 时 间 和 保持 时 间 约 束 。 该 
FSM 由 两 个 触发 器 组 成 。 上 方 触 发 器 生成 状态 位 Kg， 通过 最 大 长 度 〈 最 大 传播 延 退 ) 逻辑 路 径 
(Max) 传播 生成 信号 5。 信号 5b 依次 被 下 方 触发 器 取样 。 下 方 触发 右 生 成 信号 c， 通 过 最 小 长 
度 ( 最 小 污染 延迟 ) 电路 模块 传播 生成 信号 4， 信 号 d 被 上 方 触发 器 取样 。 注 意 最 小 延迟 路 径 
的 目标 触发 器 不 必 是 最 大 延迟 路 径 的 源 触发 器 〈 反 之 亦 然 ) 。 通 常 ， 我 们 需要 测试 从 所 有 触发 
器 到 所 有 触发 器 的 所 有 可 能 路 径 来 寻找 最 小 路 径 和 最 大 路 径 。 

图 15-6 中 ， 从 上 方 触发 器 到 下 方 触发 器 的 最 大 延迟 路 径 对 下 方 触发 器 的 建立 时 间 产 生 了 
压力 。 如 果 该 路 径 太 慢 ， 下 方 触 发 器 的 时 钟 信号 可 能 在 输入 信号 b 到达 这 个 周期 的 最 后 稳定 值 
之 前 出 现下 一 个 上 升 沿 。 图 15-7 将 图 15-6 中 该 路 径 高 亮 表示 。 此 路 径 相 对 应 的 时 序 图 如 图 15-8 
所 示 。 假 设 时 钟 信 号 上 升 沿 时 对 信和 号 d 取样 值 为 x， 然 后 ， 经 过 一 个 触发 器 传播 延迟 tico 之 后 ， 
触发 器 输出 信号 a 值 变 为 x， 并 且 在 此 时 钟 周期 剩 下 时 间 内 保持 这 个 值 。 信 和 号 a 是 组 合 逻 辑 模 
块 Max 的 输入 信号 ，Max 模块 生成 信号 54。 经 过 从 信号 a 到 信号 5 的 附加 传播 延迟 kw (该 延迟 
对 应 于 约束 条 件 (15-3) 中 的 tim) 之 后 ,信号 5 出 现 这 个 周期 的 最 终 值 f(x)。 为 了 满足 约束 
条 件 (15-3), (aS b 必须 先 于 下 一 个 时 钟 信号 上 升 沿 之 前 至 少 时 间 稳 定 保持 这 个 最 终 值 
f(x)。 通 过 最 大 路 径 的 传播 延迟 和 建立 时 间 的 和 必须 小 于 周期 时 间 。 在 时 序 图 中 ,信号 b 稍微 
提前 了 一 点 时 间 达 到 最 终 值 ， 留 下 一 点 时 间 富 裕 ， 或 松弛 时 间 1。 时 钟 周 期 1, 可 以 再 缩短 
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iua 仍 然 满足 建立 时 间 约束 。 

图 15-6 中 ， 从 下 方 触发 器 到 上 方 触发 器 的 最 小 延迟 路 径 对 上 方 触发 器 的 保持 时 间 产 生 压 
力 。 如 果 该 路 径 太 快 ， 信 号 d 可 能 在 时 钟 信 号 上 升 沿 以 后 的 保持 时 间 结 束 之 前 发 生 改 变 。 
图 15-9 高 亮 表示 了 这 条 时 序 路 径 。 图 15-10 给 出 了 只 包含 这 个 路 径 信号 的 时 序 图 。 时 钟 信和 号 
上 升 沿 后 经 过 一 个 触发 器 污染 延迟 kco， 信 号 可 能 最 先 发 生 变化 。 经 过 此 逻辑 电路 模块 的 一 
个 污染 延迟 As (该 延迟 对 应 于 约束 条 件 (15-4) 中 的 iw,) 之 后 ， 信 号 d 可 能 发 生变 化 。 为 了 
满足 保持 时 间 约 束 条 件 ， 信 和 号 d 的 最 早 变 化 在 时 钟 信号 上 升 沿 之 后 经 过 4 时 间 才 允许 发 生 。 最 
小 路 径 的 污染 延迟 的 和 必须 大 于 保持 时 间 。 在 时 序 图 中 ,污染 延迟 远 远大 于 保持 时 间 ， 有 相当 
大 的 时 间 富 裕 ， 或 松弛 时 间 tasco 





clk 


图 15-6 阐述 设置 约束 和 保持 约束 的 图 15-7 建立 时 间 约 束 。 用 阴影 表示 从 源 触发 器 
FSM 时 钟 到 目的 触发 器 时 钟 的 最 大 路 径 。 从 
时 钟 信号 上 升 沿 开始 ， 信 号 必须 经 过 最 
大 延迟 逻辑 路 径 (i466) 、 至 少 在 下 一 个 
时 钟 信号 上 升 沿 之 前 一 个 建立 时 间 (1,) 
内 传播 到 触发 器 的 输出 端 Q (taco) 








图 15-8 BREES AR AR EA EI 


Bj 15-2 建立 时 间 和 保持 时 间 
考虑 一 个 D 触发 器 ,其 中，t. =50 ps, t=40 ps, tq = tao =60 ps， 其 用 来 实现 有 限 状 态 
机 的 状态 寄存 器 。 下 一 个 状态 逻辑 电路 的 传播 延迟 为 1， =800 ps， 污 染 延 迟 为 =50 ps。 计 算 
建立 时 间 和 保持 时 间 的 松弛 时 间 ， 假 设 工 作 时 钟 频率 为 ,=1 GHZ, 
对 于 建立 时 间 约 束 ， 有 : 
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tas = WU, =tag = t g =, = 1000 — 60 - 800 - 50 = 90 ps 
保持 时 间 松 弛 时 间 为 : 
brstuck = boca * t. = by = 60 +50 - 40 = 70 ps 








1 | 
th fac 


图 15-9 保持 时 间 约 束 。 阴 影 表 示 从 源 触发 器 时 图 15-10 ”阐述 保持 时 间 约 束 条 件 的 时 序 图 
钟 到 目的 触发 器 时 钟 的 最 小 污染 延迟 路 
径 。 从 时 钟 信号 上 升 沿 开始 ， 污 染 延 迟 
必须 足够 长 ， 保 证 信号 d 能 够 保持 稳定 
值 ， 一 直到 该 时 钟 信 号 上 升 沿 之 后 一 个 
保持 时 间 th 


15.4 时 钟 偏差 的 影响 


在 理想 芯片 中 ， 所 有 触发 器 输入 端的 时 钟 信 号 同时 发 生变 化 。 实 际 上 ， 时 钟 分 布 网 络 里 边 
的 设备 变化 和 线路 延迟 导致 不 同 触 发 器 之 间 时 钟 信 号 时 序 略 微 不 同 。 我 们 称 这 种 时 钟 时 序 上 的 
空间 变化 为 时 钟 偏差 。 时 钟 偏 差 对 建立 时 间 约 束 和 保持 时 间 约 柬 都 产生 不 利 影响 。 假 设 时 钟 偏 
差 为 1, ， 这 两 个 约束 变 为 : 

ty > taco + tan +t, + t, (15-5) 
All 
t, S teco + bemin — tk (15-6) 

图 15-11 在 图 15-5 的 FSM 基础 上 增加 了 时 钟 偏差 。 延 迟 时 间 为 i。( 时 钟 偏差 的 大 小 ) 的 
延迟 线 (椭圆 形状 的 电路 模块 ) 连接 在 时 钟 信号 输入 端 和 上 方 触发 器 时 钟 之 间 。 因 此 每 个 时 
钟 信号 的 时 钟 沿 到 达 上 方 触发 器 的 时 间 要 比 到 达 下 方 触 发 器 时 间 落 后 一 个 去 的 时 间 。 延 迟 最 大 
长 度 路 径 的 源 触发 器 的 时 钟 使 得 最 大 路 径 明 显 变 长 。 以 类 似 的 方式 ， 延 迟 最 小 长 度 路 径 的 目的 
触发 器 的 时 钟 使 得 最 小 路 径 明 显 变 短 。 

时 钟 偏差 影响 最 小 长 度 路 径 ， 从 而 影响 保持 时 间 约 束 ， 如 图 15-12 所 示 。 从 时 钟 信号 到 信 
Sc 再 到 信和 号 d 的 污染 延迟 像 前 边 那样 加 上 。 然 而 ， 现 在 信号 d 必须 保持 稳定 状态 ,一 直到 延 
WRAY BP clkd Z Ji t 时 间 ， 或 者 原始 时 钟 信 号 clk 之 后 ,+t 时 间 。 这 样 的 效果 跟 保 持 时 间 增 加 
不 时 间 的 效果 一 样 。 

图 15-13 所 示 的 时 序 图 描述 了 建立 时 间 约 束 中 时 钟 偏差 的 影响 。 延 迟到 达 上 方 触发 器 的 时 
钟 信号 将 信号 a 的 传输 过 程 延 迟 了 时 间 t, ， 实 际 上 在 最 大 路 径 中 增加 了 时 间 to 
例 15-3 时 钟 偏差 

重复 例 15-2 计算 松弛 时 间 ， 加 入 时 钟 偏差 t=75 ps. 

时 钟 偏差 往往 减少 了 松弛 时 间 (时 间 富 裕 ) 。 存 在 时 钟 偏差 时 ， 建 立时 间 松 弛 时 间 计 算 公 
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式 变 为 : 
[322 | Lk = bey — laco — ta — t, — t, = 1000 — 60 — 800 — 50 - 75 = 15 ps 
存在 时 钟 偏差 时 ， 保 持 时 间 松 弛 时 间 为 : 
ti = fo + le — t = t = 60 +50 -40 =75 =-S ps 
当 存 在 75 ps 的 时 钟 偏差 时 ， 由 于 计算 出 的 松弛 时 间 为 负数 ， 该 系统 将 不 再 满足 保持 时 间 约 束 。 








“h + - back 
图 15-11 图 15-5 的 FSM 加 入 时 钟 偏差 图 15-12 显示 时 钟 偏差 对 保持 时 间 约 束 影响 的 时 序 图 











图 15-13 显示 时 钟 偏差 对 建立 时 间 约 束 影响 的 时 序 图 


15.5 时 序 实例 


现在 考虑 一 个 16 位 状态 机 的 例子 ， 该 状态 机 下 一 个 状态 是 当前 状态 的 值 乘 以 3 (图 15-14)。 
用 行 波 进位 加 法 器 〈 见 10.2 节 ) 来 计算 两 个 值 的 和 并 将 结果 存 人 触发 器 。 假 设 全 加 器 模块 来 
自任 何 输入 的 污染 延迟 km 为 10 ps, 传播 延 信 tara 9 30 ps。 触 发 器 之 间 的 最 小 污染 延迟 为 
10 ps， 最 大 传播 延迟 为 16 taa =480 ps. 
假设 触发 器 的 4co 和 tico 分 别 为 10 ps 和 20 ps。 触 发 器 有 20 ps 的 建立 时 间 ，10 ps 的 保持 时 
间 。 首 先 ， 检 查 电 路 满足 保持 时 间 约 束 : 
f, Sty E hon 
10 ps < 10 ps + 10 ps 
接 下 来 ,我 们 计算 最 大 周期 时 间 : 
bey = lace +t, +4, 
t, = 20 + 480 + 20 = 520 ps 
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这 些 方程 式 在 触发 器 参数 为 负数 的 时 候 也 是 合法 的 。 在 任何 情况 下 完成 自由 偏差 的 时 序 分 
析 都 有 相同 的 步骤 : 找到 最 小 和 最 大 逻辑 延迟 ， 检 查 方程 
x (15-3) 和 (15-4). 

为 了 构建 一 个 鲁 棒 性 更 强 的 电路 ， 我 们 希望 验证 我 们 
的 电路 没有 任何 时 序 违规 ， 甚 至 是 存在 超过 20 ps 的 时 钟 偏 
差 。 该 时 钟 偏差 可 以 是 任何 两 个 触发 占 之 间 任 何方 向 的 偏 
差 。 再次， 我 们 从 保持 时 间 开 始 : 

ta S to + tay — 1, 

10 < 10 + 10 -20 
出 错 了 ,我 们 的 电路 违反 了 保持 时 间 约 束 。 不 像 违反 建立 
时 间 约 束 那 样 ， 我 们 不 能 简单 地 增加 周期 时 间 来 解决 这 个 
问题 。 必 须 重 新 设计 触发 器 ， 修 改 时 钟 分 布 来 减少 时 钟 偏 
差 ， 或 者 在 触发 器 输入 端 增加 额外 的 逻辑 电路 。 我 们 选择 
最 简单 的 解决 方法 ， 即 增加 额外 逻辑 电路 。 这 么 做 我 们 必 
须 在 每 个 触发 器 输入 之 前 直接 增加 具有 10 ps 污染 延迟 的 逻 
辑 电路 〈 或 者 直接 在 输出 后 边 加 ) o 

必须 将 这 个 新 的 延迟 时 间 加 入 周期 时 间 的 计算 中 ( 假 
设 传播 延迟 和 污染 延迟 相同 ) : 


to Slagg + bg + betray +b, + by 








t, = 20 + 480 + 10 +20 +20 = 550 ps 本 到 < 二 15.5 人 用 到 的 e 位 电路 。 
该 实例 电路 可 以 在 频率 为 1. 8 GHz 的 时 钟 下 运行 。 EE 


个 全 加 器 ， 传 播 延 迟 来 自 

15.6 ”时序 和 逻辑 综合 16 个 全 加 器 

对 于 每 项 电路 设计 来 说 ， 我 们 在 15. 6 节 完 成 的 时 序 分 
析 必 须 在 每 种 运行 条 件 下 所 有 可 能 的 触发 器 组 合 之 间 的 所 有 逻辑 路 径 下 重复 进行 .9 手工 完成 
少量 门 电路 的 时 序 分 析 是 非常 费时 间 的 ， 并 且 容易 出 错 。 手 工 完 成 大 量 逻 辑 电 路 的 时 序 检 查 几 
乎 是 不 可 能 完成 的 。 幸 运 的 是 ， 综 合 和 时 序 分 析 工 具 为 我 们 完成 了 这 些 分 析 工 作 。 

逻辑 综合 工具 ， 将 Verilog 语言 程序 转换 为 逻辑 门 电 路 ， 每 个 门 都 有 其 对 应 的 时 序 模型 。 
给 定 运行 条 件 、 人 四 辑 电 路 以 及 约束 条 件 ， 该 工具 将 判定 任何 路 径 是 否 违反 时 序 。 如 果 侵 辑 综合 
工具 发 现时 序 违规 发 生 ， 该 工具 将 尝试 用 满足 时 序 约束 的 实现 方法 替换 以 后 的 组 合 逻辑 电路 。 
逻辑 综合 工具 用 和 迭代 的 方法 完成 设计 ， 而 不 是 经 常 开始 使 用 的 最 快 实现 设 计 的 方法 。 该 工具 首 
先生 成 一 个 最 小 范围 (或 能 量 ) 逻辑 电路 。 然 后 只 对 违反 建立 时 间 约 束 的 路 径 生 成 快速 实现 。 
例如 ，Verilog 语言 实现 加 法 器 时 首先 实现 一 个 行 波 进位 加 法 器 。 如 果 行 波 进位 加 法 器 速度 太 
慢 ， 再 用 更 快 、 更 大 的 超前 进位 加 法 器 替换 。 

标准 单元 库 以 提供 包括 触发 器 约束 在 内 的 时 序 模型 为 特点 ， 每 个 单元 都 有 一 些 工艺 角 , 设 
计 者 负责 在 约束 文件 里 规定 时 钟 信号 的 名 称 、 预 期 的 周期 时 间 、 输 入 /输出 延迟 。 图 15-15 给 
出 了 一 个 用 Tel 语言 编写 的 实例 脚本 ， 规 定 这 些 约束 条 件 ， 启 用 综合 工具 。 该 脚本 导入 RTL 文 
件 〈 一 个 控制 可 编程 计数 器 的 状态 机 ) 、 设 置 时 钟 信 号 名 称 和 周期 (ns) 、 创 建 时 钟 、 规 定 输 





O 保持 时 间 违 规 在 最 优 实例 多 辑 延迟 (高 电压 和 低温 度 ) 情况 下 出 现 频率 更 高 。 建 立时 间 违 规 在 低 操作 电压 和 
热 片 等 最 差 的 实例 条 件 下 最 常见 。 

这 些 模 型 和 其 他 特征 数据 由 标准 单元 库 的 供应 商 提供 。 特 征 化 一 个 标准 单元 库 往 往 比 设计 一 个 标准 单元 库 需 
要 更 多 的 精力 。 
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和 输出 延迟 。 综 合 工具 的 输出 信号 包括 一 个 所 有 违反 时 序 约束 的 逻辑 路 径 的 列表 。 例 如 ， 
15-16 给 出 了 例子 中 的 错误 路 径 。 该 路 径 从 程序 计数 器 的 11 位 运行 到 26 位 ,在 触发 器 设置 
窗口 内 没有 到 达 目 标 状态 。 

除了 综合 工具 完成 的 时 序 分 析 之 外 ， 通 常用 独立 的 静态 时 序 分 析 (STA) 工具 来 验证 最 后 
的 设计 (包括 互联 寄生 现象 ) 是 否 满足 所 有 时 序 约束 。 

我 们 可 以 用 时 序 模型 完成 Verilog 仿真 。 然 而 ， 这 样 的 仿真 只 能 发 现 输入 向 量 (所 仿真 案例 ) 
激活 关键 路 径 的 时 序 错 误 。 由 于 很 难 证 明 测 试 到 了 所 有 路 径 ， 时 序 仿真 不 足以 证 明 芯 片 满 足 所 有 
时 序 约束 。 静 态 时 序 分 析 能 够 发 现 所 有 违反 时 序 约束 的 路 径 ， 可 以 用 来 证 明 芯 片 满足 所 有 时 序 。 


set top pc 28bit top 


set src files [list\ 
./rtl/pce_28bit_top.v\ 
./rtl/pe_28bit.v ] 

read_verilog -rtl ${src_files} 


current_design ${top} 

# Clocks 

set clk_name CLK 

set clk period 1 

create clock -name ${clk_name} -period ${clk_period} N 
[get_ports ${clk_name}] 


set input delay .2 -clock CLK $all_inputs 
set output delay .5 -clock CLK $all_outputs 





图 15-15 Tel 脚本 的 一 部 分 ， 用 于 创建 一 个 周期 为 1 ns 的 时 钟 信号 。 同 时 设置 系统 的 输 





入 延迟 和 输出 延迟 分 别 为 200 ps 和 500 ps 
Des/Clust/Port Wire Load Model Library 
pc_28bit_top area_1Kto2K CORE 
Point Incr Path 


clock CLK (rise edge) 0.00 0.00 

clock network delay (ideal) 0.00 0.00 

I pc 28bit/PC reg[11] /CP (DFPQX9) 0.00 0.00 r 
I pc 28bit/PC_reg[11]/Q (DFPQX9) 0.20 0.20 £ 
U382/Z (BFX53) 0.08 0.28 £ 
U197/Z (NAND2X7) 0.06 0.34 r 
U458/Z (OAT12X18) 0.05 0.39 £ 
U267/Z (AOI21X12) 0.03 0.42 r 
U265/Z (OAI21X12) 0.03 0.45 f 
U257/Z (IVX18) 0.06 0.5124 
U256/Z (AND2X35) 0.10 0.614r 
U358/Z (NAND2X7) 0.05 0.66 f 








图 15-16 综合 之 后 违反 建立 时 间 约 束 的 实例 路 径 。 该 路 径 是 许多 错误 路 径 中 特定 的 一 条 ， 
从 程序 计数 器 的 第 11 位 运行 到 第 26 位 。 通 常 ， 从 Verilog 行为 描述 转换 成 门 电路 
时 ， 逻 辑 信 号 的 名 称 是 模棱两可 的 
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U628/Z (XNOR2X18) 0 . 

U430/Z (NAND2X14) 0.05 0.81 r 
U533/Z (NAND3X13) 0.11 0.92 £ 
I_pe_28bit/PC_reg[26]/D (DFPQX9) 0.00 0.92 £ 


data arrival time 0.92 





clock CLK (rise edge) 1.00 1.00 
clock network delay (ideal) 0.00 1.00 
I_pe_ 28bit/PC_reg(26]/CP (DFPQX9) 0.00 1.00 r 
library setup time -0.12 0.88 
data required time 0.88 
data required time 0.88 
data arrival time -0.92 


slack (VIOLATED) 


Al 15-16 (4%) 


小 结 


通过 本 章 我 们 学 习 了 如 何 分 析 同 步 逻辑 电路 的 时 序 。 组 合 逻 辑 电路 模块 的 时 序 由 两 个 数字 
描述 。 电 路 的 污染 延迟 ，tw， 指 的 是 从 输入 信号 a 发 生 任 何 变化 开始 ， 直 到 输出 信号 5 的 先前 
的 稳定 状态 值 被 改变 或 被 污染 所 经 过 的 时 间 。 污 染 延迟 对 分 析 保 持 时 间 违 规 是 非常 重要 的 。 电 
路 的 传播 延迟 ，tuw， 指 的 是 输入 信号 a 最 后 一 次 变化 完成 ， 到 输出 信号 设置 好 它 在 时 钟 周 期 
剩余 时 间 保 持 的 稳定 状态 值 所 用 的 时 间 。 传 播 延 迟 用 于 分 析 建 立时 间 违 规 。 

D 触发 器 或 寄存 器 的 时 序 由 4 个 数字 进行 管理 。 寄 存 器 的 输入 信号 必须 在 时 钟 上 升 沿 之 前 
保持 建立 时 间 1. 长 度 的 稳定 状态 ， 在 时 钟 信号 上 升 沿 之 后 还 要 保持 保持 时 间 4 长 度 的 稳定 状 
态 。 如 果 寄 存 器 满足 建立 时 间 和 保持 时 间 约 束 ， 则 寄存 器 的 输出 信号 在 时 钟 信 号 上 升 沿 后 污染 
延迟 tw 时 间 之 后 被 污染 〈 先 前 的 值 不 再 保持 稳定 ) ， 时 钟 信 号 上 升 沿 之 后 再 经 过 传播 延迟 时 间 
lu 之 后 稳定 在 新 的 状态 值 。 对 于 大 多 数 触发 器 ，!。, =li ， 并 且 触 发 器 的 状态 一 步 到 位 转换 到 
最 终 状态 。 

根据 这 些 组 合 软 辑 电 路 和 寄存 器 的 时 序 性 能 ， 能 够 推导 出 寄存 器 满足 保持 时 间 约 束 的 条 
件 为 

t, S teco + bemin — tk 
寄存 器 满足 建立 时 间 约 束 的 条 件 为 
bey = Laco tiima tb, +t 
Hoh RRRA, tu e Br 44 RG BE RER, tay, E Ei 41 AA EY aK fE 8 
延迟 。 

在 实际 中 ,我 们 用 静态 时 序 分 析 工 具 验 证 设计 满足 建立 时 间 约 束 和 保持 时 间 约 束 。 这 些 工具 

计算 设计 中 所 有 可 能 的 组 合 路 径 的 延迟 ， 并 验证 每 一 个 触发 器 都 满足 建立 时 间 和 保持 时 间 约 束 。 


文献 说 明 

Dally 和 Poulton [32], Weste 和 Harris [108] 对 我 们 的 简单 的 基于 触发 器 的 时 钟 方案 和 更 
加 复杂 的 基于 锁 存 器 方案 的 时 序 分 析 进 行 了 详细 介绍 。 综 合 和 最 优化 工具 用 到 的 算法 描述 见 参 
考 文献 [77], Brunvand [20] 最 近 的 一 本 书 详细 介绍 了 设计 过 程 ， 包 括 商 业 时 序 分 析 工具 的 
使 用 。 
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15.4 


15.5 
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传播 和 污染 延迟 ，I。 计 算 图 15-17 中 每 一 个 输入 信号 到 输出 信号 的 传播 延迟 和 污染 延迟 。 假 设 每 
个 门 有 10 ps 的 延迟 。 


BEP 


图 15-17 习题 15.1 用 的 简单 的 组 合 电 路 


传播 和 污染 延迟 ，I。 计 算 图 15-18 所 示 电 路 中 从 触发 器 A 到 输出 信号 的 污染 延迟 和 传播 延迟 。 假 
设 信号 通过 每 个 门 的 延迟 为 10 ps。 





图 15-18 习题 15.2 ~ 习题 15.6 用 的 简单 电路 。 每 个 触发 器 标注 单位 为 皮 秒 ， 每 个 门 有 
10 ps 的 延迟 


传播 和 污染 延迟 ，II。 计 算 图 15-18 所 示 电 路 中 从 触发 器 B 到 输出 信号 的 污染 延迟 和 传播 延迟 。 
假设 信号 通过 每 个 门 的 延迟 为 10 ps。 

传播 和 污染 延迟 ，IV。 计 算 图 15-18 所 示 电 路 中 从 触发 器 C 到 输出 信和 号 的 污染 延迟 和 传播 延迟 。 
假设 信号 通过 每 个 门 的 延迟 为 10 ps。 

传播 和 污染 延迟 ，V。 计 算 图 15-18 所 示 电 路 中 从 触发 器 D 到 输出 信号 的 污染 延迟 和 传播 延迟 。 假 
设 信 号 通过 每 个 门 的 延迟 为 10 ps。 

传播 和 污染 延迟 ，VI。 图 15-18 所 示 电 路 的 全 部 污染 延迟 和 传播 延迟 是 什么 ? 假设 信号 通过 每 个 
门 的 延迟 为 10 ps。 

设置 和 保持 ，I。 为 表 15-1 的 触发 器 A 画 出 波形 图 ， 显 示 触 发 器 的 输入 信和 号 在 i, 前 变 为 高 电 平 ， 在 
t, 之 后 变 为 低 电 平 。 包 括 clk、D 和 Q (以 前 状态 为 0) 。 在 图 中 标记 所 有 约束 。 








表 15-1 习题 中 用 到 的 3 个 不 同 的 触发 器 规格 
参数 ( ps) FF A FF B FF C 
t 20 100 -30 
ti 10 -20 80 
teco 10 2 40 
taco 20 30 50 
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15.8 


15.9 


15. 10 


15. 11 


15. 12 


15. 13 


15. 14 


15. 15 


15. 16 


15. 17 


15. 18 


15. 19 


15. 20 


设置 和 保持 ，I。 为 表 15-1 的 触发 器 B MKEK, ib sh Be a A ë =E t, 前 变 为 高 电 平 ， 
TE tn 之 后 变 为 低 电 平 。 包 括 elk. D 和 Q (以 前 状态 为 0)。 在 图 中 标记 所 有 约束 。 

设置 和 保持 ，III。 为 表 15-1 的 触发 器 C 画 出 波形 图 ， 显 示 触 发 器 的 输入 信号 在 到 前 变 为 高 电 平 ， 
TE tn 之 后 变 为 低 电 平 。 包 括 elk. D 和 Q (以 前 状态 为 0) 。 在 图 中 标记 所 有 约束 。 
设置 和 保持 违规 ，I。 对 于 表 15-1 中 的 触发 器 A 和 

一 个 2 GHz 的 时 钟 信 号 ， 检 查 图 15-19 所 示 电 路 的 

时 序 违规 行为 。 如 果 存 在 保持 违规 ， 表 明 需 要 增加 逻辑 A 


必要 的 延迟 ， 增 加 延迟 后 重新 检查 建立 时 间 违 规 行 ig! ap 
d= ps A 


为 。 如 果 存 在 设置 违规 ， 则 计算 最 大 的 无 差错 时 钟 
频率 。 

HEPR EH, M, HFK 15-1 中 的 触发 器 B 和 
一 个 2 GHz 的 时 钟 信 号 ， 检 查 图 15-19 所 示 电 路 的 
时 序 违 规 行为 。 如 果 存 在 保持 违规 ， 表 明 需 要 增加 
必要 的 延迟 ， 增 加 延迟 后 重新 检查 建立 时 间 违 规 行 
为 。 如 果 存 在 设置 违规 ， 则 计算 最 大 的 无 差错 时 钟 
频率 。 

设置 和 保持 违规 ，II。 对 于 表 15-1 中 的 触发 器 C 
和 一 个 2 GHz 的 时 钟 信号 ， 检 查 图 15-19 所 示 电 路 
的 时 序 违规 行为 。 如 果 存 在 保持 违规 ， 表 明 需 要 增 
加 必要 的 延迟 ， 增 加 延迟 后 重新 检查 建立 时 间 违 规 
A 习题 15.22 ~ 习题 15.24 用 到 
ZAHR, L RISI 中 的 触发 器 A 和 一 个 1 GHz HRR 

的 时 钟 信 号 ， 对 于 划分 成 两 个 触发 器 的 任何 逻辑 电路 模块 ， 其 最 小 上 和 最 大 EtA? 
BEAk, H. 表 15-1 中 的 触发 器 B 和 一 个 1 GHz 的 时 钟 信 号 ， 对 于 划分 成 两 个 触发 器 的 任何 逻 
辑 电 路 模块 ， 其 最 小 上 和 最 大 与 是 什么 ? 

Bk, M, X 15-1 中 的 触发 器 C 和 一 个 1 GHz 的 时 钟 信号 ， 对 于 划分 成 两 个 触发 器 的 任何 
逻辑 电路 模块 ， 其 最 小 t. 和 最 大 4 是 什么 ? 

避免 保持 违规 ，I。 假 设 你 是 一 位 电路 设计 师 ， 在 自由 偏差 环境 中 实现 一 个 触发 器 ， 消 除 所 有 保 
持 违规 行为 。 写 出 能 使 你 设计 的 触发 器 避免 出 现 故障 的 不 等 式 。 

避免 保持 违规 ，I。 假 设 你 是 一 位 电路 设计 师 ， 在 偏差 为 去 的 环境 中 实现 一 个 触发 器 ， 消 除 所 有 
保持 违规 行为 。 写 出 能 使 你 设计 的 触发 器 避免 出 现 故障 的 不 等 式 。 

后 期 制作 违规 。 芯 片 烧 录 完 成 后 从 加 工厂 回来 ， 发 现 芯 片 不 工作 。 如 何 能 够 测试 故障 原因 是 和 否 是 
设置 或 保持 违规 引起 的 ?描述 测试 如 何 进行 。 

时 钟 延迟 。 假 设 图 15-20 所 示 的 内 部 触发 器 中 ,t= 如 =50 ps, taco =tecg =80 ps。 那 么 外 部 触发 
ARHI tes tpo tacos teco TANEL? 


Al 15-19 习题 15. 10 ~ 习题 15.12 以 及 





图 15-20 ”在 时 钟 输入 信号 和 内 部 触发 器 之 间 增 加 两 个 反 相 器 构 成 外 部 触发 器 ， 两 个 反 
相 器 的 组 合 延 迟 为 40 ps。 习题 15.19 使 用 该 电路 图 


数据 延迟 。 重 新 完成 习题 15. 19 ， 两 个 反 相 器 不 再 放 在 clk 输入 端 ， 而 是 放 在 d 输入 端 。 
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输出 延迟 。 重 新 完成 习题 15. 19， 两 个 反 相 器 不 再 放 在 clk 输入 端 ， 而 是 放 在 q 输出 端 。 

时 钟 偏 差 ，I。 计 算 图 15-19 中 电路 允许 的 最 大 时 钟 偏差 。 指 出 该 时 钟 偏差 出 现在 哪 两 个 触发 器 之 

间 ， 以 及 该 时 钟 偏差 是 否 触发 设置 或 保持 违规 行为 。 使 用 触发 器 规格 A 和 一 个 ns 的 时 钟 信号 。 

列 出 所 有 可 能 路 径 ， 并 写 出 设置 和 保持 方程 式 。 

时 钟 偏差 ,I。 重 新 完成 习题 15. 22 ， 使 用 触发 器 规格 B 和 一 个 2 ns 的 时 钟 信和 号。 

时 钟 偏差 ，II。 重 新 完成 习题 15. 22， 使 用 触发 器 规格 C 和 一 个 4 ns 的 时 钟 信号 。 

时 序 分 析 。 两 个 64 位 的 数字 相 乘 得 到 一 个 128 位 的 结果 。 

(a) 假设 输入 信号 和 输出 信号 由 触发 器 终止 ， 则 在 该 系统 中 有 多 少 开始 触发 器 和 结束 触发 器 的 
组 合 ? 

(b) 手动 检查 一 条 寄存 器 到 寄存 器 路 径 的 违规 行为 需要 30 s。 如 果 想 用 9 种 不 同 的 进程 检查 这 些 
路 径 中 每 条 路 径 的 设置 和 保持 违规 ， 估 算 完 成 该 乘法 器 的 全 部 时 序 分 析 所 需要 的 时 间 。 


| 第 16 章 


Digital Design: A Systems Approach 


数据 通路 时 序 逻 辑 





在 第 14 章 ， 我 们 看 到 了 如 何 从 状态 图 对 有 限 状 态 机 进行 综合 ， 通 过 写 出 下 一 个 状态 函数 
并 综合 逻辑 电路 实现 这 个 表 。 然 而 ， 对 于 许多 时 序 函 数 ， 用 表达 式 描述 下 一 个 状态 函数 要 比 用 
表 描 述 简单 得 多 。 这 样 的 函数 用 数据 通路 描述 和 实现 更 有 效 ， 其 下 一 个 状态 用 逻辑 函数 计算 ， 
经 常 涉及 算术 运算 电路 、 多 路 选择 器 和 其 他 基础 单元 电路 。 


16.1 计数 器 


16. 1. 1 简单 计数 器 

假设 要 用 图 16-1 给 出 的 状态 图 构建 一 个 有 限 状 态 机 。 当 电路 输入 信号 > 为 真 时 电路 复位 到 
状态 0。 当 输入 信号 7 为 假 时 ， 状 态 机 从 0 到 31 进行 计数 ， 然 后 再 返回 状态 0。 由 于 电路 的 这 
种 计数 行为 ,我们 称 这 个 有 限 状 态 机 为 计数 器 。 





图 16-1 5 位 计数 器 的 状态 图 





可 以 用 第 14 章 介 绍 的 方法 设计 这 个 计数 器 。 用 module Counterl(clk,rst,out) ; 
该 方法 设计 的 3 位 计数 器 (8 种 状态 ) 的 Verilog 描 input ret, clk + // Aifa ia 
述 如 图 16-2 所 示 。83 位 宽度 的 触发 器 保持 当前 状态 | n i one i 
count 并 且 在 每 个 时 钟 信 号 上 升 沿 到 来 时 根据 下 一 
个 状态 next 对 其 进行 更 新 。casex 语句 直接 读 取 DFF #(3) count(clk, next, out) ; 
状态 表 ， 为 每 个 输入 信号 和 当前 状态 的 组 合 指定 下 


reg [2:0] next ; 





always@(*) begin 





一 个 状态 。 casex({rst,out}) 
虽然 这 种 方法 可 以 完成 计数 器 设计 ,但 是 设计 4'blxxx: next = 0 ; 
的 计数 器 程序 元 长 且 效 率 低下 。 状 态 表 部 分 行 是 重 ns 
复 的 。 状 态 机 的 行为 完全 可 以 由 一 条 语句 获得 : ps 
assign next = rst ? 0 : count +1 ; 4'd3: next = 4 ; 
4’d4: next = 5; 
该 语句 是 有 限 状 态 机 的 数据 通路 描述 ， 在 该 描述 中 4'd5: next = 6 ; 
将 下 一 个 状态 表示 为 当前 状态 和 输入 信号 的 函数 。 4'd6: next = 7 1 
4'd?: next = 0 3 


eg Perit T= TSS eae : 位 计数 default: next = 0 ; 
器 模块 的 Verilog 程序 。n 位 宽度 的 触发 器 保持 当前 | endoase 
状态 count ， 并 在 每 个 时 钟 信号 上 升 沿 到 来 时 用 下 | ena 
一 个 状态 next 的 值 更 新 当前 状态 。 一 条 assign [Lendmodule 
语句 描述 下 一 个 状态 函数 。 当 rst 信号 为 高 电 平时 ”图 16-2 用 状态 表 定义 的 3 位 计数 器 FSM 








O 用 此 方法 实现 5 位 计数 器 (32 种 状态 ) 需要 32 行 的 状态 表 。 
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下 一 个 状态 为 0， 否 则 下 一 个 状态 为 count +1. 


module Counter(clk, rst, count) ; 





parameter n=5 ; 
input rst, clk ; // 复位 和 时 钟 信和 号 
output [n-1:0] count ; 


wire [n-1:0] next = rst? 0 : count+l ; 


DFF #(n) count(clk, next, count) ; 





endmodule 


图 16-3 用 单个 assign if Aye LW n (i BR FSM 


该 计数 器 的 框图 如 图 16-4 所 示 。 该 图 表明 了 该 实现 方法 的 数据 通路 性 质 。 下 一 个 状态 由 
== 流 经 包括 组 合 基 础 单元 电路 (包括 算术 模块 和 多 路 选择 器 ) 的 路 径 数据 计算 得 出 。 在 这 种 情 
! | ” 况 下 ， 两 个 基础 单元 为 多 路 选择 器 和 增 量 器 ， 其 中 ， 多 路 选择 器 用 于 选择 复位 (0) 还 是 增 量 
332| (count +1) ， 增 量 器 用 于 将 count 增加 到 count +1。 








图 16-4 简单 计数 器 框图 。 计 数 器 状态 用 状态 寄存 器 保存 (触发 器 ) 。 下 一 个 状态 由 多 路 选择 
器 产生 ， 如 果 rst 信号 有 效 则 为 0， 否则 输出 状态 的 增 量 (count +1) 


一 般 来 说 ， 时 序数 据 通路 电路 采用 图 16-5 所 示 的 形式 。 像 任何 同步 时 序 逻 辑 模块 一 样 ， 状 态 
寄存 器 保存 状态 值 。 输 出 逻辑 模块 将 输出 信号 表示 为 输入 信号 和 当前 状态 的 函数 进行 计算 。 下 一 
个 状态 表示 为 输入 信号 和 当前 状态 的 函数 ， 由 下 一 个 状态 模块 进行 计算 。 数 据 通路 的 特点 是 下 一 
个 状态 逻辑 和 输出 逻辑 用 函数 表示 而 不 是 用 表 表示 。 对 于 简单 的 计数 右 来 说 ， 输 出 逻辑 就 是 当 
前 状态 ， 下 一 个 状态 逻辑 是 选择 增 量 或 者 设置 为 0。 在 后 面 的 章节 中 我 们 将 看 到 更 加 复杂 的 时 
序数 据 通路 电路 的 例子 。 但 是 ， 所 有 数据 通路 电路 都 保留 下 一 个 状态 和 输出 信号 的 函数 描述 。 





状态 
寄存 器 


图 16-5 一般 情况 下 ， 时 序数 据 通路 电路 包含 一 个 状态 寄存 器 、 下 一 个 状态 逻辑 和 输出 逻辑 。 
下 一 个 状态 模块 和 输出 模块 由 函数 进行 描述 而 不 用 表 进 行 描述 


16. 1.2 加 一 / 减 一 / 载 入 计数 器 


我 们 给 出 的 简单 计数 器 下 一 个 状态 只 有 两 种 选择 : 复位 或 增 量 。 通 常 计 数 器 的 下 一 个 状态 
需要 有 更 多 选择 。 与 需要 向 上 计数 一 样 ， 计 数 器 也 需要 向 下 计数 ( 减 量 ); 也 可 能 有 的 情况 下 
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需要 保持 现 有 状态 ; 偶尔 还 需要 给 计数 器 载 人 一 个 任意 值 。 

图 16-6 给 出 了 一 个 这 样 的 加 一 / 减 一 / 载 和 人 (UDL) 计数 器 。 该 计数 器 有 4 个 控制 输入 信 
号 (rst, up, down, load), 一 个 nn 位 宽 的 数据 输入 im。 下 一 个 状态 函数 直接 由 casex 
语句 描述 。 如 果 复 位 信号 (rst) 有 效 ， 下 一 个 状态 是 0。 否 则 ， 如 果 up 有 效 ， 下 一 个 状态 
为 out +1。 如 果 down 有 效 (up Al rst 无效 ) ， 计 数 器 通过 设置 下 一 个 状态 为 out -1 实现 
计数 需 减 量 计 数 。 当 信和 号 load 有 效 时 ,计数器 通过 设置 下 一 个 状态 为 in 来 进行 计数 值 载 人 。 
最 后 ， 如 果 输 入 控制 信号 都 无 效 ， 计 数 器 通过 设置 下 一 个 状态 为 out 来 保持 当前 状态 值 。 

这 个 描述 精确 计算 UDL 计数 器 的 函数 ,满足 大 部 分 需求 。 然 而 ， 在 计数 器 需要 实例 化 为 
增 量 器 (计算 out +1) 和 减 量 器 (计算 out-1) 时 ,该 设计 就 显得 效率 低下 了 。 我 们 通过 
对 计算 机 算法 的 简单 学 习 (25 10 章 )， 知道 这 两 个 电路 可 以 合并 。 

如 果 节 省 一 些 门 电路 资源 对 于 当前 设计 非常 重要 (这 种 情况 不 太 可 能 出 现 ) ， 我 们 可 以 描 
述 一 个 更 加 经 济 实 用 的 计数 器 电路 ， 如 图 16-7 所 示 。 该 电路 在 casex 语句 之 外 考虑 增 量 和 减 
量 问题 ， 取 而 代 之 的 是 用 信号 outpml (out 加 1 或 减 1) 实现 。 该 信号 用 assign 语句 生 
成 ， 当 up 为 假 时 out 2& 1, `4up 为 真 时 out 加 1。 其 他 代码 与 图 16-6 一 样 。 





module UDL_Counti(clk, rst, up, down, load, in, out) ; 
parameter n = 4 ; 
input clk, rst, up, down, load ; 
input [n-1:0] in ; 
output [n-1:0] out ; 
reg [n-1:0] next ; 


DFF #(n) count(clk, next, out) ; 


always@(*) begin 
casex({rst, up, down, load}) 


4'blxxx: next = {n{1'bo}} ; 
4'b01xx: next = out + 1’bl ; 
4'b001x: next = out - 1'bh1 ; 
4'b0001: next = in ; 
default: next = out ; 


endcase 





end 


endmodule 


图 16-6 加 一 / 减 一 / 载 人 (UDL) 计数 器 的 Verilog 语言 描述 


图 16-8 显示 了 UDL 计数 器 的 框图 。 同 图 16-4 所 示 的 简单 计数 器 和 大 部 分 数据 通路 电路 一 
样 ，UDL 计数 器 电路 用 多 路 选择 器 为 下 一 个 状态 选择 不 同 选项 。 这 些 选 项 中 有 一 些 由 功能 单元 
创建 。 多 路 选择 器 有 4 个 输入 信和 号: 选择 输入 值 (load) 、 增 量 器 / 减 量 器 输出 信号 (up 或 
down) O (reset), 、 计 数 (hold) 。 信 和 号 功能 单元 是 一 个 增 量 器 / 减 量 器 ， 能 从 当前 计数 值 加 一 
或 减 一 。 信 号 线 down 控制 是 加 操作 还 是 减 操作 。 一 个 组 合 逻 辑 模块 通过 译 码 控制 输入 信和 号 来 
生成 多 路 选择 器 的 选择 信号 。 该 框图 相应 的 Verilog 程序 见 图 16-9。 


16.1.3 定时 器 


在 许多 应 用 中 ， 比 如 一 个 更 加 复杂 版 本 的 交通 灯 控 制 器 ， 我 们 需要 一 个 能 够 设置 为 初始 时 
间 4 的 定时 器 ,个 时 间 周 期 之 后 ， 用 信号 告诉 我 们 时 间 结 束 。 这 类 似 于 厨房 定时 器 ,设置 一 
个 时 间 间 隔 ， 当 时 间 结 束 后 发 出 声音 信号 。 
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module UDL_Count2(clk, rst, up, down, load, in, out) ; 
parameter n = 4 ; 
input clk, rst, up, down, load ; 
input [n-1:0] in ; 
output [n-1:0] out ; 
wire [n-1:0] outpml ; 
reg [n-1:0] next ; 


DFF #(n) count(clk, next, out) ; 
assign outpml = out + {{n-1{~up},1’b1} ; 


always@(*) begin 
casex({rst, up, down, load}) 





4'bixxx: next = {n{1'bo}} ; 
4'b01xx: next = outpml ; 
4'b001x: next = outpml ; 
4‘b0001: next = in ; 
default: next = out ; 
endcase 
end 
endmodule 





=] 





图 16-7 使 用 Verilog 语言 描述 具有 共享 增 量 器 / 减 量 器 的 加 一 / 减 一 / 载 人 (UDL) 计数 器 





图 16-8 加 一 / 减 一 / 载 人 (UDL) 计数 器 的 框图 


图 16-10 显示 了 一 个 定时 器 FSM 的 框图 。 该 定时 器 遵循 我 们 熟悉 的 原理 ， 用 多 路 选择 器 从 
常量 、 输 入 信号 、 功 能 单元 的 输出 信号 〈 此 例 中 为 一 个 减 量 器 ) 中 选择 下 一 个 状态 。 所 不 同 
的 是 这 个 框图 包括 一 个 输出 功能 单元 。 当 计数 达到 零 时 零 检测 器 将 信号 done 声明 为 有 效 。 

要 运行 定时 器 ， 时 间 间 隔 应 用 于 输入 信号 in， 控 制 信号 load 用 于 载 信 时间 间 隔 。 载 和 时间 
间隔 以 后 ， 每 个 周期 内 部 变量 count 减 计数 。 当 count 达到 零 之 后 ， 输 出 信号 done 有 效 ， 停止 
计数 。 复 位 输入 信号 rst 只 用 于 在 定时 器 上 电 时 进行 初始 化 操作 。 

定时 器 的 Verilog 描述 如 图 16-11 所 示 。 风 格 类 似 于 简单 计数 器 以 及 使 用 多 路 选择 器 和 状态 
寄存 器 的 结构 化 UDL 计数 器 。 减 量 器 在 多 路 选择 器 的 参数 列表 中 实现 。 为 了 保持 定时 器 持续 
减 量 ， 当 done 信号 有 效 并 且 load 信号 无 效 时 选择 多 路 选择 器 的 零 输 入 操作 。 最 后 的 assign 
语句 实现 零 检 测 器 功能 。 


RICE RBBB AHP iH 













parameter n = 4 ; 

input clk, rst, up, down, load ; 
input [n-1:0] in ; 

output [n-1:0] out ; 

wire [n-1:0] next, outpml ; 


DFF #(n) count(clk, next, out) ; 













(“rst & load), 


rst}, 
next) ; 
endmodule 


图 16-9 
MA (UDL) 计数 器 


module UDL_Count3(clk, rst, up, down, load, in, out) ; 


assign outpml = out + {{n-1{down}},1'b1} ; 


Mux4 #(n) mux(out, in, outpm1, {n{1’b0}}, 
{(“rst & “up & “down & ~load), 


(“rst & (up | down)), 















使 用 Verilog 语言 描述 具有 共享 增 量 器 / 减 量 器 和 显 式 的 多 路 选择 器 的 加 一 / 减 一 / 








// 定时 器 模块 

// 重 置 计数 设置 为 0 

// 加 载 计数 值 设置 为 in 

// 否则 进行 减 计 数 ， 直 到 计数 值 为 0 (不 包括 0) 
// 当 计 数值 为 0 时 done 有 效 

module Timer(clk, rst, load, in, done) ; 
parameter n=4 ; 
input clk, rst, load ; 
input [n-1:0] in ; 
output done ; 

wire [n-1:0] count, next_count ; 
wire done ; 





DFF #(n) cnt(clk, next_count, count) ; 





图 16-11 定时 器 的 Verilog 


语言 描述 
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Mux3 #(n) mux(count-1’bi, in, {n{1’b0}}, 
{Trst & “load & “done, 
load & “rst, 


rst | (done & ~load)}, 
next_count) ; 
assign done = ~(|count) ; 
endmodule 








图 16-11 (4%) 


例 16-1 加 3/ 减 3 计数 器 

写 出 任意 宽度 计数 器 的 Verilog 程序 模块 ， 计 数 器 复位 后 ， 如 果 输 入 信号 inc HK, MH 
个 时 钟 周期 进行 加 3 操作 ， 如 果 输 入 信号 dec 有 效 ， 则 每 个 时 钟 周期 进行 减 3 操作 ， 否 则 保持 
原 值 不 变 。 

Verilog 程序 如 图 16-12 所 示 。 定 义 outpm3 ， 如 果 dec 有 效 则 值 为 out -3， 否 则 值 为 
out +3， 从 而 实现 增 量 和 减 量 共享 一 个 加 法 器 。casex 语句 用 来 实现 多 路 选择 器 ， 为 next 
选择 合适 的 值 。 如 果 inc 和 dec 同时 有 效 ， 则 next 为 任意 未 定义 的 值 x. 





module IncDecBy3(clk, rst, inc, dec, out) ; 
parameter n=8 ; 
input cik, rst, ine, dec ; 
output [n-1:0] out ; 
reg [n-1:0] next ; 


DFF #(n) sr(clk, next, out) ; 
wire [n-1:0] outpm3 = out + (dec ? (~2) : 3) ; 


always @(*) begin 
casex({rst,inc,dec}) 
3'blxx: next = 0 ; // 复位 
3'b010: next = outpm3 ; // 加 计数 
3'b001: next = outpm3 ; // 减 计 数 
3‘b000: next = out ; // 保持 
default: next = {n{1’bx}} ; 
endcase 





end 
endmodule //IncDecBy3 





图 16-12 加 3/ 减 3 计数 器 的 Verilog 语言 描述 


16.2 移 位 寄存 器 

除了 增 量 、 减 量 和 比较 之 外 ， 移 位 是 另 一 个 常用 的 数据 通路 功能 。 移 位 器 在 串 行 器 和 串 并 
转换 器 中 相当 有 用 ， 串 并 转换 器 用 于 将 并 行 数据 转换 成 串 行 数据 ， 也 可 以 反 过 来 将 串 行 数据 转 
换 成 并 行 数据 。 
16.2.1 一 个 简单 的 移 位 寄存 器 

图 16-13 给 出 了 一 个 简单 移 位 寄存 器 的 框图 ， 图 16-14 给 出 了 其 Verilog 描述 。 除 非 移 位 寄 
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存 器 复位 ， 和 否则 其 下 一 个 状态 总 是 当前 状态 左 移 一 位 得 到 的 结果 ， 输 入 信号 sin 填充 最 右边 
一 位 (LSB). FA Verilog 编程 实现 时 ， 二 选 一 多 路 选择 器 用 条 件 语句 “? :” 结 构 实现 ， 左 移 由 
以 下 表达 式 实 现 : 


{out [n-2:0], sin} 


在 这 里 ， 连 接 操作 用 sin 连接 out fa SRAM n - 1 fi, Kip ERE out 信号 左 移 一 位 ， 
然后 将 sin 信号 插入 LSB, 

例如 ， 这 个 简单 的 移 位 寄存 器 可 以 用 作 串 并 转换 器 。 输 入 信号 sin 接收 串 行 输入 ,每 过 n 
个 时 钟 周期 ， 就 可 以 从 信和 号 out 读 出 并 行 输出 结果 。 还 需要 某 些 框架 协议 来 确定 每 个 并 行 符 
号 启动 和 停止 的 位 置 ， 即 在 哪个 时 钟 周期 内 应 该 读 出 并 行 数据 。 

















//---==-=-=—- A m W 
// 基本 移 位 寄存 器 

// ret 将 out 设 置 为 0,， 和 否则 out 值 左 移 sin 填 充 LSB 
ee unn a E aaa 


module Shift_Register1 (clk, rst, sin, out) ; 
parameter n = 4 ; 
input clk, rst, sin ; 
output [n-1:0] out ; 





wire [n-1:0] next = rst ? {n{1’b0}} : {out[n-2:0],sin} ; 


DFF #(n) cnt(clk, next, out) ; 
endmodule 


图 16-14 简单 移 位 寄存 器 的 Verilog 语言 描述 。 如 果 rst 信号 有 效 ， 寄 存 器 设置 为 全 0; A 
则 寄存 器 左 移 ， 并 用 输入 信号 sin 填充 LSB 











16.2.2 左 移 / 右 移 / 载 入 移 位 寄存 器 


类 似 于 复杂 计数 器 ， 我 们 可 以 设计 复杂 的 移 位 寄存 器 ， 能 够 载 和 人 数据， 并 且 可 以 实现 任意 
方向 的 移 位 。 该 左 移 / 右 移 / 载 人 (LRL) 移 位 寄存 器 的 框图 如 图 16-15 所 示 ， 其 Verilog 编程 实 
现 如 图 16-16 所 示 。 该 模块 用 casex 语句 选择 0、 左 移 (用 拼接 实现 ) 、 右 移 (也 用 拼接 实 
现 ) 、 输 入 和 输出 。 注 意 移 位 表达 式 


{out [n-2:0],sin} 
{sin, out [n-1:1]} 


并 不 产生 实际 逻辑 电路 。 移 位 操作 只 是 简单 的 连 线 ， 将 信号 sin 和 信号 out 选 定 的 位 数 作 为 
多 路 选择 器 的 合适 的 输入 位 。 
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图 16-15 左 移 / 右 移 / 载 入 移 位 寄存 器 的 框图 








module LRL Shift Register(clk, rst, left, right, load, sin, in, out) ; 
parameter n = 4 ; 
input clk, rst, left, right, load, sin ; 
input [n-1:0] in ; 
output [n-1:0] out ; 
reg [n-1:0] next ; 





DFF #(n) cnt(clk, next, out) ; 


always @(*) begin 
casex({rst,left,right,1load}) 
4'blxxx: next = 0 ; // 复位 
4’bO1lxx: next = {out[n-2:0],sin} ; // 左 移 
4'b001x: next = {sin,out[n-1:1]} ; // ## 


4’b0001: next = in ; // RX 
default: next = out ; // 保持 
endcase 
end 
endmodule 








图 16-16 左 移 / 右 移 / 载 人 移 位 寄存 器 的 Verilog 语言 描述 


16.2.3 通用 移 位 器 /计数 器 


如 果 使 LRL 移 位 寄存 器 模块 具有 增 量 、 减 量 、 测 零 的 功能 ， 则 该 移 位 寄存 器 模块 可 以 代 
蔡 本 节 中 介绍 过 的 任何 模块 。 这 个 想法 并 不 像 看 起 来 那么 遥 不 可 及 。 开 始 你 可 能 会 认为 ， 当 我 
们 只 需要 一 个 简单 计数 器 时 去 用 一 个 全 功能 模块 是 浪费 。 然 而 ， 大 多 数 综合 系统 通过 假设 常量 
输入 来 消除 永远 不 会 使 用 的 电路 逻辑 ( 即 如 果 up 和 dowm 信号 一 直 为 零 ， 则 增 量 器 / 减 量 器 功 
能 将 会 被 消除 ) 。 因 此 ， 在 实践 中 无 用 逻辑 不 应 该 占用 任何 资源 。” 通用 移 位 器 /计数 器 的 优点 
是 它们 都 只 包含 一 个 单一 模块 需要 记 住 和 维护 。 


O 在 使 用 此 方法 之 前 ， 用 你 的 综合 系统 验证 其 正确 性 。 
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通用 移 位 器 /计数 器 模块 的 Verilog 编程 实现 如 图 16-17 所 示 。 该 代码 在 很 大 程度 上 结合 
以 上 各 个 模块 的 代码 。 该 程序 用 一 个 7 输入 多 路 选择 器 在 输入 信号 、 当 前 状态 、 增 量 、 减 量 、 
左 移 、 右 移 、 零 之 间 进 行 选 择 。 增 量 / 减 量 通过 assign 语句 实现 (与 UDL 计数 器 一 样 ) ， 移 
位 通过 拼接 实现 (与 LRL 移 位 器 一 样 ) 。 

通用 模块 的 一 个 创新 点 在 于 使 用 仲裁 器 RArb 来 确保 同一 时 刻 多 路 选择 器 不 会 选择 两 个 输 
入 同时 有 效 。 该 仲裁 在 模块 前 面 进行 显 式 定义 。 根 据 7 个 选择 输入 信号 ， 很 容易 对 仲裁 器 进行 
实例 化 来 实现 此 逮 辑 。 在 许多 通用 移 位 器 /计数 器 〈 或 任何 其 他 数据 通路 模块 ) 的 应 用 中 ,我 
们 能 够 保证 在 同一 时 刻 不 会 有 两 个 命令 输入 信号 有 效 。 在 这 种 情况 下 ， 我 们 不 需要 仲裁 (无 论 
通过 模块 还 是 通过 显 式 定 义 来 进行 仲裁 ) 。 然 而 ， 为 了 验证 命令 输入 确实 是 独 热 码 ， 在 模块 中 
编写 一 个 声明 是 有 用 的 。 例 如 ， 要 判断 一 个 信号 是 独 热 码 ， 代 码 可 以 写 为 

assign count = in[0]+in[1]+...+in[n-1] ; 

assign error = 


设计 者 必须 在 每 个 时 钟 沿 检测 此 错误 条 件 。 此 声明 是 一 个 逻辑 表达 式 ， 不 生成 门 电路 ,” (B E: 
如 果 仿 真 过程 中 违反 了 此 表达 式 ， 则 对 错误 进行 标识 。 


eount > 1 ; 








// 通用 移 位 器 /计数 器 

// 按 优先 顺序 列 出 输入 信号 

// rst 将 状态 重 置 为 0 

// left 一 一 将 目前 状态 左 移 ,用 sin 填 充 最 低 有 效 位 
// right 一 一 将 目前 状态 右 移 ,用 sin 填 充 最 高 有 效 位 
// up 一 一 加 计数 状态 

// down 一 一 减 计 数 状态 ， 状 态 不 能 小 于 0 

// load 一 一 从 信号 in 载 入 数值 





// 
// 输出 信号 done 表 示 状 态 为 全 0 
oe 


module UnivShCnt (clk, rst, left, right, up, down, load, sin, in, out, done) ; 
parameter n = 4 ; 





input clk, rst, left, right, up, down, load, sin ; 
input [n-1:0] in ; 





output [n-1:0] out ; 
output done ; 
wire [6:0] sel ; // 多 路 选择 器 选择 信号 ， 由 仲裁 命令 生成 


wire [n-1:0] next, outpml ; 


assign outpmi = out + {{n-1{~up}},1'b1} ; // 对 out 进 行 加 计数 或 减 计数 
DFF #(n) cnt(clk, next, out) ; 
RArb #(7) arb({rst, left, right, up, down & “done, load, 1’b1}, sel) ; 
Mux7 #(n) mux({n{1’b0}}, {out [n-2:0],sin}, {sin,out[n-1:1]}, 

outpml, outpml, in, out, sel, next); 





assign done = “(|out) ; 
endmodule 


16-17 通用 移 位 器 /计数 器 的 Verilog 描述 ， 使 用 共享 增 量 器 / 减 量 器 和 显 式 多 路 选择 器 实 
现 。 通 过 使 用 仲裁 来 保证 同一 时 刻 多 路 选择 器 只 有 一 个 输入 选择 端 有 效 





O “许多 综合 工具 有 相应 的 内 置 命令 来 声明 哪些 逻辑 不 应 该 进行 综合 。 例 如 ，S$ynopsys 公司 的 设计 编译 器 使 用 // 
synthesis translate_ off 和 //synthesis translate_ on 命令 来 停止 或 启动 综合 。 
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例 16-2 可 变 的 移 位 位 数 
编写 移 位 寄存 器 的 Verilog 程序 模块 ， 通 过 一 个 两 位 输入 信号 sh_amount 决定 左 移 0 位 、 
1 位 、2 位 或 3 位 。 右 端 填充 位 由 一 个 3 位 输入 信号 sin 决定 ， 并 且 遵 循 最 高 有 效 位 优先 。 
Verilog 程序 如 图 16-18 所 示 。 首 先 我 们 用 sin 信号 和 out 信号 进行 拼接 ， 这样 有 效 实现 
out 信号 左 移 3 位 。 然 后 将 拼接 后 的 值 进行 右 移 ， 右 移 位 数 由 3 - sh_amount 决定 ， 此 过 程 
用 sin 信号 高 位 优先 的 原则 进行 填充 ， 将 out 信号 放置 到 正确 位 置 。 





module VarShift(clk, rst, sh_amount, sin, out) ; 
parameter n=8 ; 

input clk, rst ; 

input [1:0] sh_amount; 

input [2:0] sin ; 

output [n-1:0] out ; 


DFF #(n) sr(clk, next, out) ; 





wire [n-1:0] next = rst ? 0 : {out,sin} >> (3-sh_amount) ; 
endmodule 








16-18 {j 16-2 描述 的 可 变 移 位 位 数 移 位 器 的 Verilog 程序 


16.3 控制 和 数据 分 区 


数字 设计 中 一 个 共同 的 主题 就 是 将 一 个 模块 划分 为 控制 有 限 状 态 机 和 数据 通路 ， 如 图 16-19 
所 示 。 就 像 本 章 中 介绍 的 移 位 寄存 器 和 计数 器 一 样 ， 数 据 通路 通过 多 路 选择 器 和 功能 单元 计算 
其 下 一 个 状态 。 另 一 方面 ， 控 制 FSM 通过 状态 表 计 算 其 下 一 个 状态 。 模 块 的 输入 信号 分 为 控 
制 输入 (影响 控制 FSM 的 状态 ) 和 数据 输入 (为 数据 通路 提供 数值 ) 。 模 块 的 输出 信号 也 按 类 
似 方 式 进 行 划 分 。 控 制 FSM 通过 一 组 命令 信号 控制 数据 通路 的 操作 。 数 据 通路 通过 一 组 状态 
言 号 对 控制 FSM 进行 通信 反馈 。 





图 16-19 系统 经 常 划分 为 数据 通路 和 控制 模块 ， 在 数据 通路 中 下 一 个 状态 由 功能 单元 决定 ， 
在 控制 模块 中 下 一 个 状态 由 状态 表决 定 
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本 章 中 我 们 看 到 的 计数 器 和 移 位 器 是 这 种 结构 进行 退化 的 例子 。 每 个 都 包含 一 个 数据 通路 
和 一 个 控制 单元 。 数 据 通路 包含 多 路 选择 器 和 功能 单元 〈 移 位 器 、 增 量 器 和 加 法 器 ) 。 但 是 它 
们 的 控制 单元 是 严格 的 组 合 逻 辑 。 数 据 通 路 命令 ( 如 多 路 选择 器 选择 命令 和 加 / 减 控制 命令 ) 
和 控制 输出 仅仅 是 当前 控制 输入 和 数据 通路 状态 的 函数 。 在 本 节 中 我 们 将 研究 两 个 模块 实例 ， 
这 两 个 模块 的 控制 部 分 包含 内 部 状态 。 


16.3.1 实例 : 自动 售 货 机 FSM 


考虑 为 软饮料 自动 售 货 机 设计 一 个 控制 器 的 问题 。 具 体 规 范 如 下 。 自 动 售 货机 接受 五 分 、 
一 角 、 两 角 五 分 硬币 。 当 有 硬币 投入 投 币 口 时 ， 在 表示 五 分 、 一 角 、 两 角 五 分 硬币 类 型 的 三 条 
信号 线 中 ， 其 中 一 条 出 现 一 个 周期 的 时 钟 脉冲 。 所 售 商 品 的 价格 通过 售 货 机 的 一 个 位 内 置 开 
关 进 行 设置 (以 五 分 为 单位 )， 并 通过 位 信号 price 输入 到 控制 器 中 。 当 投入 足够 的 硬币 来 购 
买 软饮料 时 ， 状 态 信 号 enough 有 效 。 当 enough 信号 有 效 时 ， 用 户 按 下 dispense 按钮 ，serve 信 
号 保持 一 个 周期 的 有 效 状态 ， 表 示 供 应 软饮料 。serve 信号 有 效 状 态 之 后 ，FSM 必须 等 待 直到 
done 信号 有 效 为 止 ， 表 示 机 械 设 备 完 成 供应 软饮料 的 操作 。 服 务 完 成 之 后 ， 如 果 需 要 售 货 机 将 
给 消费 者 找 零 。 一 次 找 零 五 分 ，change 信和 号 保持 一 个 时 钟 周期 的 有 效 状 态 ， 直 到 信和 号 done 有 
效 ， 表 示 完 成 一 次 找 零 五 分 操作 ， 接 下 来 根据 需要 继续 找 零 或 找 零 结 束 返 回 原 始 状态 。 任 何 时 
间 done 信号 有 效 时 ， 必 须 等 到 done 信号 变 为 低 电 平 之 后 才能 进行 后 续 活 动 。 

我 们 从 考虑 自动 售 货 机 的 控制 部 分 开始 。 首先， 看 一 下 输入 输出 信号 。 除 price 之 外 的 所 
有 输入 信号 (rst, nickel, dime, quarter, dispense, done) 都 是 控制 输入 信号 , .所 有 输出 信号 
(serve 和 change) 都 是 控制 输出 信和 号。 我 们 需要 的 来 自 数据 通路 模块 的 状态 信号 包括 enough 信 
号 (表示 投入 了 足够 的 钱 ) 和 zero 信号 (表示 不 用 支付 更 多 零钱 )。 我 们 将 在 后 面 看 到 数据 状 
态 的 时 候 考虑 发 送 到 数据 通路 的 命令 。 

现在 考虑 自动 售 货 机 控制 部 分 的 状态 。 如 图 16-20 所 示 ， 自 动 售 货机 有 三 个 主要 工作 阶 
段 . 首先 ， 在 投 币 阶段 (状态 deposit) ， 使 用 者 进行 投 币 ， 并 按 下 按钮 dispense。 当 信号 dis- 
pense 和 信号 enough 都 有 效 时 ， 自 动 售 货 机 进入 服务 阶段 (状态 servel 和 serve2 ) 。 在 servel 状 
态 等 待 done 信号 有 效 表示 软饮料 供应 完成 ， 在 serve2 状态 等 待 done 信号 有 效 来 解除 状态 锁定 。 
我 们 认为 输出 信号 serve 在 第 一 个 时 钟 周期 只 能 为 状态 servel 。 如 果 不 需 要 找 零 ，zero 信号 有 
效 ，FSM 从 serve2 状态 返回 投 币 状态 。 然 而 ， 如 果 需 要 找 零 ，ESM 进入 找 零 阶段 (状态 
changel 和 change2)。 自 动 售 货 机 在 这 些 状态 之 间 不 断 循 环 ， 宣 布 进入 找 零 阶段 后 ， 在 changel 
状态 等 待 done 有 效 ， 然 后 在 change2 状态 等 待 done 信号 变 为 低 电 平 。 我 们 在 每 次 转换 成 
changel 状态 时 的 第 一 个 时 钟 周期 对 输出 信号 change 进行 更 新 维护 。 只 有 当 所 有 找 零 都 完成 之 


后 状态 才能 返回 到 投 币 状态 。 


图 16-20 自动 售 货 机 控制 器 控制 部 分 的 状态 图 。 为 了 使 状态 图 更 加 清晰 ， 我 们 省 略 了 从 一 个 状态 
到 该 状态 自身 的 边 。 如 果 从 某 状态 出 发 的 边 上 所 有 的 逻辑 条 件 都 不 满足 ， 则 状态 机 保持 





done' & zero 





日 ”在 这 张 图 中 ,省 略 了 从 一 个 状态 到 其 自身 的 边 。 如 果 从 某 状态 出 发 的 所 有 边 的 条 件 都 不 满足 ， 则 FSM 保持 在 
当前 状态 不 变 。 
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我 们 已 经 完成 了 控制 状态 的 定义 ， 现 在 开始 关注 数据 状态 。 该 FSM 包含 一 个 数据 状 
态 一 一 以 五 分 为 单位 表示 的 自动 售 货 机 当前 所 占有 的 消费 者 的 钱币 总 量 。 我 们 称 此 状态 变量 为 
amount。 影 响 amount 变量 的 不 同 活动 为 : 

e 复位 : amount—0; 

e 投入 硬币 : amount«—amount + value, EX Œ value =1、2 或 5， 相 应 地 表示 五 分 、 一 角 和 

两 角 五 分 ; 

e 供应 饮料 : amounte amount - price; 

e 找 回 五 分 零钱 : amounte amount - 1; 

。 其 他 情况 : amount 保持 不 变 。 

现在 我 们 可 以 设计 一 个 数据 通路 来 完成 这 些 操作 。 状 态 变量 amount 可 以 清 零 、 增 加 、 减 
少 或 保持 不 变 。 根 据 这 些 寄 存 器 传送 情况 ， 我 们 明白 需要 图 16-21 所 示 的 数据 通路 。 总 量 的 下 
一 个 状态 next 通过 一 个 三 选 一 多 路 选择 器 实现 ， 选 择 0、amount 或 sum 中 的 一 个 ， 其 中 sum 是 
加 法 /减法 单元 的 输出 信号 ， 该 单元 从 amount 增加 或 减少 value (Ë, value 由 一 个 四 选 一 多 路 选 
择 器 对 输入 信号 1、2、5 或 price 进行 选择 。 从 这 张 图 中 我 们 可 以 看 出 控制 数据 通路 需要 的 命 
令 信 号 为 两 个 多 路 选择 器 的 选择 信号 和 加 法 /减法 单元 的 控制 信号。 


price 












amount 


sub_addN 


serve 
nickel 


quarter 





dispense 


图 16-21 自动 售 货 机 控制 器 的 框图 


自动 售 货 机 控制 器 的 Verilog 程序 如 图 16-22 ~ 图 16-25 所 示 。 顶 层 模块 如 图 16-22 所 示 。 
该 模块 仅仅 实例 化 了 控制 模块 (VendingMachineControl) 和 数据 模块 (VendingMa- 
chineData), 并 将 它们 连接 起 来 。 命 令 信 号 sub. selval 和 selnext, 以 及 状态 信号 
enough 和 zero 都 在 这 一 层 进 行 声明 。 

自动 售 货 机 控制 器 控制 模块 的 Verilog 程序 分 成 了 两 张 图 。 图 16-23 显示 模块 的 第 一 部 分 ， 
该 部 分 包括 生成 输出 信号 和 命令 变量 的 逻辑 电路 。 定 义 一 个 变量 first 用 来 区 分 状态 servel 
和 changel 的 第 一 个 周期 。 在 这 两 个 状态 中 任何 一 个 状态 经 过 一 个 周期 以 后 first 变量 都 变 为 
低 电 平 。 该 变量 使 我 们 在 每 次 访问 这 些 状态 时 只 需要 保持 一 个 周期 的 输出 值 ， 并 且 每 次 访问 
changel 状态 时 amount 只 衰减 一 次 。 如 果 没 有 first 变量 , 我 们 需要 将 状态 servel 和 
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changel 分 别 扩展 为 两 个 状态 。first 信号 分 别 和 servel, changel 中 为 真 的 信号 相 与 得 到 输出 


信号 serve 和 change. 






//VendingMachine—WEWH ss 
// 仅仅 将 数据 模块 和 控制 模块 进行 连接 

















module VendingMachine(clk, rst, nickel, dime, quarter, dispense, done, price, 
serve, change) ; 
parameter n = ‘DWIDTH ; 
input clk, rst, nickel, dime, quarter, dispense, done ; 
input [n-1:0] price ; 
output serve, change ; 


wire enough, zero, sub ; 
wire [3:0] selval ; 


wire [2:0] selnext ; 


VendingMachineControl vmc(clk, rst, nickel, dime, quarter, dispense, done, 








enough, zero, serve, change, selval, selnext, sub) ; 









VendingMachineData #(n) vmd(clk, selval, selnext, sub, price, enough, zero) ; 
endmodule 


图 16-22 自动 售 货 机 控制 器 的 Verilog 程序 顶层 模块 ， 仅 仅 声 明 控 制 模块 和 数据 模块 ， 并 
将 它们 连接 起 来 


module VendingMachineControl(clk, rst, nickel, dime, quarter, dispense, done, 
enough, zero, serve, change, selval, selnext, sub) ; 
input clk, rst, nickel, dime, quarter, dispense, done, enough, zero ; 
output serve, change, sub ; 
output [3:0] selval ; 
output [2:0] selnext ; 
wire [‘SWIDTH-1:0] state, next ; // 当前 状态 和 下 一 个 状态 
reg [‘SWIDTH-1:0] mextl ; // 下 一 个 状态 w/o 复 位 


// 输出 信号 

wire first ; // 在 servel 或 changel 的 第 一 个 时 钟 周 期 有 效 
wire servel = (state == ‘SERVE1) ; 

wire changel = (state == ‘CHANGE1) ; 

assign serve = servel & first ; 

assign change = changel & first ; 


// 数据 通路 控制 
wire dep = (state == ‘DEPOSIT) ; 
// price, 1, 2, 5 


wire [3:0] selval = {(dep & dispense), 


((dep & nickel) | change), 
(dep & dime), 
(dep & quarter) } ; 

// amount, sum, 0 





图 16-23 ”自动 售 货 机 控制 器 的 控制 模块 的 Verilog 程序 描述 (两 部 分 中 的 第 一 部 分 ) 。 该 控制 
模块 的 第 一 部 分 给 出 了 用 assign 语句 实现 的 输出 信号 和 命令 变量 
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wire selv = (dep & (nickel | dime | quarter | (dispense & enough))) | 
(change & first) ; 

wire [2:0] selnext = {~(selv | rst), “rst & selv,rst} ; 

// 减法 

wire sub = (dep & dispense) | change ; 


// 只 有 在 serve1 或 changel 的 第 一 个 时 钟 周期 执行 
wire nfirst = !(servel | changel) ; 
DFF #(1) first_reg(clk, nfirst, first) ; 











图 16-23 (8%) 


数据 通路 控制 信号 由 输入 信号 和 状态 变量 决定 。 这 两 个 选择 信和 号 为 独 热 码 变量 。 每 一 位 由 
一 个 逻辑 表达 式 决 定 。 信 和 号 selval (选择 输入 到 加 法 /减法 单元 的 值 ) 在 投 币 状态 (信号 
dep 有 效 ) JH dispense 按 下 时 选择 price 的 值 。 当 在 投 币 状 态 投入 五 分 硬币 或 者 在 找 零 
状态 时 选择 1。 相 应 地 ， 当 在 投 币 状态 投入 一 角 硬 币 或 者 两 角 五 分 硬币 时 分 别 选择 2 和 5。 信 
号 selnext 为 amount 变量 选择 下 一 个 状态 。 如 果 复 位 信号 rst 有 效 则 选择 零 。 如 果 selv 
信号 有 效 则 选择 加 法 /减法 单元 的 输出 结果 。 其 他 情况 下 ， 选 择 amount 的 当前 值 。 在 投 币 状 
态 下 投入 硬币 时 或 者 dispense 信号 和 enough 信号 都 有 效 时 变量 selv AM; 在 找 零 状态 
下 如 果 first 信号 有 效 则 selv 信号 有 效 。 注 意 当 在 投 币 状态 下 dispense 有 效 时 我 们 可 以 
选择 price， 这 是 因为 如 果 enough 信号 也 有 效 时 我 们 只 选择 加 法 /减法 单元 的 输出 值 。 最 
后 ， 加 法 /减法 单元 的 控制 信号 控制 电路 在 dispense 和 change 有 效 时 进行 减法 ， 其 他 情况 
加 法 器 进行 加 法 运算 。 

控制 模块 的 第 二 部 分 给 出 了 下 一 个 状态 逻辑 ， 如 图 16-24 所 示 。 该 逻辑 用 casex 语句 实 
现 , 假设 情况 由 4 个 输入 位 和 当前 状态 连接 而 成 。 大 多 数 转换 为 一 个 单独 的 case 语句 编程 实 
现 。 例 如 ， 自 动 售 货 机 处 于 投 币 状态 ,并 且 dispense 和 enough 信和 号 都 有 效 ， 执 行 第 一 条 
case 语句 4'b11xx，'DEPOSIT。 该 语句 使 得 自动 售 货 机 处 于 投 币 状态 时 对 后 两 种 情况 进行 编 
码 。 一 条 单独 的 assignment 语句 将 FSM 复位 到 投 币 状态 。 

// 状态 寄存 器 


DFF #(‘SWIDTH) state_reg(clk, next, state) ; 


// 下 一 个 状态 逻辑 
always @(*) begin 
casex({dispense, enough, done, zero, state}) 
{4’blixx,‘DEPOSIT}: nextl ‘SERVE1 ; // dispense & enough 
{4'bOxxx, DEPOSIT}: next1 ‘DEPOSIT ; 
{4'bx0xx, ‘DEPOSIT}: nextl ‘DEPOSIT ; 
{4'bxx1x,‘SERVE1}: nextl = ‘SERVE2 ; // done 


{4'bxx01, ‘SERVE2}: next1 
{4'bxx00,‘SERVE2}: nextl 
{4'bxx1x, `SERVE2): next1 
{4'bxx1x, ‘CHANGE1}: Dext1 
{4’bxx0x, ‘CHANGE1}: nextl 


‘DEPOSIT ; “done & zero 
‘CHANGE ; “done & “zero 
`SERVE2 ; done 
`CHANGE2 ; done 
`CHANGE1 ; done 





{4'bxx0x,‘SERVE1}: nextl = ‘SERVEL ; 


图 16-24 ”自动 售 货 机 控制 器 的 控制 模块 的 Verilog 程序 描述 (两 部 分 中 的 第 二 部 分 ) 。 该 控 
制 模块 的 第 二 部 分 用 casex 语句 实现 了 下 一 个 状态 函数 
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{4’bxx00,‘CHANGE2}: nextl = ‘CHANGE! ; // “done & “zero 
{4’'bxx01,‘CHANGE2}: nextl = ‘DEPOSIT ; // “done & zero 
{4‘bxx1x,‘CHANGE2}: nextl = ‘CHANGE2 ; // “done & zero 
endcase 


end 






// 重 置 下 一 个 状态 
assign next = rst ? ‘DEPOSIT : next1l ; 
endmodule 


E 16-24 (#) 


自动 售 货 机 控制 器 数据 通路 的 Verilog 描述 如 图 16-25 所 示 。 该 程序 紧 随 图 16-21 给 出 的 数 
据 通路 部 分 。 一 个 状态 寄存 器 保存 当前 总 量 。3 输入 多 路 选择 器 将 0、 加 法 /减法 单元 的 sum 
输出 或 amount 的 当前 值 反馈 给 状态 寄存 器 。 加 法 /减法 单元 完成 从 amount 增加 或 减少 val- 
ue 的 值 。4 输入 多 路 选择 器 选择 要 被 加 或 减 的 value 的 值 。 最 后 ， 两 个 assign 语句 生成 状 
态 信号 enough 和 zero. 





module VendingMachineData(clk, selval, selnext, sub, price, enough, zero) ; 
parameter n = 6 ; 
input clk, sub ; 
input [3:0] selval ; // price, 1, 2, 5 
input [2:0] selnext ; // amount, sum, 0 
input [n-1:0] price ; // 用 五 分 为 单位 表示 的 软饮料 价格 
output enough ; // amount > price 
output zero ; // amount = zero 


wire [n-1:0] sum; // 加 法 /减法 单元 的 输出 值 

wire [n-1:0] amount ; // 当前 硬币 总 价值 

wire [n-1:0] next ; // 下 一 个 状态 硬币 总 价值 

wire [n-1:0] value ; // 需要 从 总 价值 增加 或 减少 的 值 
wire ovf ; // Mh, HABA 


// 保存 当前 总 价值 的 状态 寄存 器 


DFF #(n) amt(clk, next, amount) ; 


// 从 0、sum 或 hold 中 选择 下 一 个 状态 


Mux3 #(n) nsmux (amount, sum, {n{1’b0}}, selnext, next) ; 


// 从 当前 总 价值 中 增加 或 减少 一 个 数值 


AddSub #(n) add(amount, value, sub, sum, ovf) ; 


// 选择 需要 增加 或 减少 的 值 


Mux4 #(n) vmux(price, ‘NICKEL, ‘DIME, ‘QUARTER, selval, value) ; 





// 比较 器 

wire enough = (amount >= price) ; 

wire zero = (amount == 0) ; 
endmodule 











图 16-25 ”自动 售 货 机 控制 器 的 数据 通路 


自动 售 货 机 控制 器 的 测试 平台 如 图 16-26 所 示 ， 在 此 平台 对 控制 器 进行 仿真 的 波形 如 
图 16-27 所 示 。 测 试 从 重 置 售 货 机 开始 。 投 入 一 枚 五 分 硬币 ， 接 着 投入 一 枚 一 角 硬 币 ， 使 
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amount 443 (15 分 ) 。 这 时 ， 我 们 等 待 一 个 时 钟 周 期 不 投入 硬币 ， 以 保证 amount 的 值 稳 
定 在 3。 然 后 我 们 更 新 dispense 信号 以 确保 在 没有 投入 足够 的 硬币 之 前 不 能 够 供应 软饮料 。 
接 下 来 我 们 在 连续 的 两 个 时 钟 周期 内 投入 两 个 两 角 五 分 ， 使 amount 变 为 8 然后 再 变 为 13。 当 
amount 达到 13 时 ， 由 于 超出 了 商品 价格 (11) ， 信 号 enough 变 为 高 电 平 。 经 过 一 个 空闲 时 
钟 周 期 ， 我 们 再 一 次 更 新 dispense 信号。 这 次 售 货 机 工作 了 。 状 态 推进 到 001 (servel) 并 
H amount 减少 为 2( 减 去 了 商品 价格 11). 

在 状态 servel 的 第 一 个 时 钟 周期 (state=001), serve 信号 有 效 。 售 货机 再 保持 此 状态 一 
个 周期 ， 等 待 done 信号 变 为 高 电 平 。 当 done 信和 号 已 经 变 为 低 电 平 之 后 ， 在 serve2 (state = 
011) 状态 只 需要 一 个 时 钟 周 期 ， 紧 接着 进入 状态 changel (state =010 ) 。 在 changel 状态 的 第 
一 个 时 钟 周期 ， 输 出 信号 change AM (返还 给 消费 者 五 分 硬币 ) amount 的 值 减少 为 1。 
售 货 机 再 保持 changel 状态 一 个 时 钟 周期 ， 用 于 等 待 done 信号 有 效 。 由 于 信号 zero 无 效 ， 
接 下 来 只 需要 一 个 时 钟 周 期 就 可 以 从 change2 (state =100) 状态 返回 到 changel 状态 。change 
信号 再 一 次 有 效 ，amount 值 在 changel 状态 的 第 一 个 时 钟 周 期 再 一 次 减少 1。 这 一 次 amount 
值 变 为 0， 信 号 zero 有 效 。 在 changel 状态 等 待 第 二 个 时 钟 周期 之 后 ， 由 于 zero 信号 有 效 ， 
售 货 机 状态 通过 change2 状态 返回 到 投 币 状态 ， 准 备 重新 开始 。 




































module testVend ; 
reg clk, rst, nickel, dime, quarter, dispense, done ; 
reg [3:0] price ; 
wire serve, change ; 


VendingMachine #(4) vm(clk, rst, nickel, dime, quarter, dispense, done, price, 
serve, change) ; 


// 周期 为 10 个 时 间 单元 的 时 钟 信号 
initial begin 
elk = 1; #5 clk = 0 ; 
forever 
begin 
$display("%tb th th %b $b", 
{nickel,dime,quarter,dispense}, vm.vmc.state, vm.vmd.amount, serve, change); 
#5 clk = i ¿+ #5 clk = 0 ; 
end 





end 


// 给 予 及 时 的 反馈 

always @(posedge clk) begin 
done = (serve | change) ; 

end 


initial begin 
rst = 1; {nickel, dime, quarter, dispense} = 4'b0 ; price = ‘PRICE ; 
#25 rst = 0 ; 
#10 {nickel, dime, quarter, dispense} = 4'b1000 ; // 五 分 硬币 ， 总 值 为 1 
#10 {nickel, dime, quarter, dispense} = 4'b0100 ; // 一 角 硬 币 ， 总 值 为 3 
#10 {nickel, dime, quarter, dispense} = 4'b0000 ; // 空 操作 
#10 {nickel, dime, quarter, dispense} = 4’b0001 ; // 尝试 提前 执行 
#10 {nickel, dime, quarter, dispense} = 4'b0010 ; // 两 角 五 分 ， 总 值 为 8 
#10 {nickel, dime, quarter, dispense} = 4'b0010 ; // 两 角 五 分 ， 总 值 为 13 
#10 {nickel, dime, quarter, dispense} = 4’b0000 ; // 2 j /E 
#10 {nickel, dime, quarter, dispense} = 4'b0001 ; // 售 出 饮料 ， 总 值 为 2 
#10 dispense = 0 ; 
#100 S$stop ; 

end 

endmodule 





图 16-26 自动 售 货 机 控制 器 的 Verilog 测试 平台 
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图 16-27 用 图 16-26 所 
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图 16-28 给 出 了 实现 自动 售 货 机 的 另 一 种 方法 ， 用 一 个 单独 模块 实现 。 除 了 省 略 掉 了 产生 
信号 selval 和 selnext 的 逻辑 之 外 ， 该 售 货 机 的 控制 部 分 同 图 16-23 和 图 16-24 完全 相同 。 
数据 通路 使 用 一 个 单独 的 case 语句 来 选择 增 量 ，inc， 当 amount 为 常量 时 该 增 量 为 0。 


module VendingMachinel(clk, rst, nickel, dime, quarter, dispense, done, price, 
serve, change) ; 
parameter n = ‘DWIDTH ; 
input clk, rst, nickel, dime, quarter, dispense, done ; 
input [n-1:0] price ; 
output serve, change ; 


wire [‘SWIDTH-1:0] state, next ; // 当前 状态 和 下 一 个 状态 

reg [‘SWIDTH-1:0] nextl ; // 下 一 个 状态 w/o 复位 

wire [n-1:0] amount, namount ; // 数据 通路 状态 以 及 下 一 个 状态 
reg [n-1:0] inc ; // 增 量 

wire first ; // 状态 的 第 一 个 周期 


// 译 码 

wire servel = (state == ‘SERVE1) ; 
wire changel = (state == ‘CHANGE1) ; 
wire deposit = (state == ‘DEPOSIT) ; 


wire nfirst = !(servel | changel) ; // 不 处 于 servel 或 changel 状 态 


// 状态 寄存 器 

DFF #(‘SWIDTH) state_reg(clk, next, state) ; 
DFF #(n) data_reg(clk, namount, amount) ; 
DFF #(1) first_reg(clk, nfirst, first) ; 


// 输出 
wire serve = (state == ‘SERVE1) & first ; 
wire change = (state == ‘CHANGE1) & first ; 


// 状态 信号 
wire enough = (amount >= price) ; 
wire zero = (amount == 0) ; 


// 选择 增 量 的 数据 通路 
always @(*) begin 
casex({nickel, dime, quarter, deposit, serve, change}) 
{6'bxxx010}: inc = -price ; 
{6’'b100100}: inc ‘NICKEL ; 
{6'b010100}: inc = ‘DIME ; 
{6'b001100}: inc = ‘QUARTER ; 
{6’bxxx001}: inc = -‘NICKEL ; 
default: inc = {n{1’b0}} ; 
endcase 
end 


// 选择 下 一 个 硬币 总 值 的 数据 通路 


assign namount = rst ? 0 : amount + inc ; 


图 16-28 用 单独 模块 实现 自动 售 货 机 控制 器 的 相同 版 本 。 数 据 通路 用 单独 的 casex 语句 实现 
选择 一 个 增 量 。 两 部 分 中 的 第 一 部 分 ， 第 二 部 分 完全 等 同 于 图 16-24 
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16.3.2 实例 : 密码 锁 


作为 第 二 个 控制 和 数据 通路 的 实例 ， 考 虑 一 个 从 十 进 制 键盘 接收 输入 信息 的 电子 密码 锁 。 
用 户 必须 输入 十 进 制 数字 序列 构成 的 密码 ， 然 后 按 下 确认 (enter) 键 。 如 果 用 户 输入 了 正确 的 
密码 序列 ， 则 输出 信号 unlock 有 效 (假设 表示 开动 门 站 来 开门 )。 为 了 使 其 重新 上 锁 ， 用 户 需 
要 再 次 按 下 确认 键 。 如 果 用 户 输入 的 密码 序列 不 正确 ， 输 出 信号 busy 有 效 ， 并 且 启 动 一 个 定 
时 器 ， 经 过 预先 设置 的 时 间 之 后 才 允 许 该 用 户 再 次 进行 开锁 。 忙 指示 灯 只 有 在 用 户 输入 完整 的 
密码 序列 并 且 按 下 确认 键 之 后 才 可 以 开启 。 如 果 忙 指示 灯 在 用 户 输入 第 一 个 错误 密码 位 时 点 
亮 ， 则 给 用 户 提供 了 破解 密码 的 信息 ， 一 次 可 以 破解 一 位 密码 。 

该 密码 锁 系 统 有 3 个 输入 信号 : key, key_valid 和 enter, 4 位 编码 key 表示 当前 输入 的 按 
键 ， 信 号 key_valid 表示 按键 有 效 。 输 入 键盘 是 经 过 预 处 理 的 ， 每 次 按键 维持 一 个 时 钟 周期 的 
有 效 期 。 同 样 enter 信和 号 也 经 过 了 预 处 理 , 保证 用 户 每 次 按 下 确认 键 来 开锁 或 重新 上 锁 时 该 
信号 保持 一 个 时 钟 周期 的 有 效 期 。 密 码 序列 的 长 度 由 内 部 变量 length 来 进行 设置 ， 密 码 序列 保 
存在 内 部 存储 器 中 。 

图 16-29 显示 了 密码 锁 控 制 部 分 的 状态 图 。 密 码 
锁 复 位 到 开始 状态 (enter)。 在 此 状态 密码 锁 接 收 输 
入 信息 。 每 次 有 键 按 下 时 ， 同 预期 的 数字 进行 检测 。 
如 果 检 测 结 果 正 确 (kmatch)， 密 码 锁 继续 保持 开始 
状态 等 待 输入 ; 如 果 检 测 结 果 不 正确 (valid A 
kmatch) ， 密 码 锁 转换 到 waitl 状态 。 密 码 锁 保 持 
wail 状态 ， 直 到 有 确认 键 按 下 时 ， 进 入 wait2 状态 。 
在 wait2 状态 密码 锁 启 动 一 个 定时 器 ， 并 且 保 持 此 状 
态 ， 在 定时 器 done 信号 有 效 之 前 保持 信号 busy 有 效 。 

当 整 个 密码 都 全 部 正确 输入 之 后 ， 密 码 锁 还 保持 
在 开始 状态 ， 并 且 Imach 为 真 。 在 此 开始 状态 下 错误 
的 输入 数字 会 将 状态 转换 为 waitl 。 只 有 输入 的 密码 
长 度 同 内 部 length 变量 一 致 时 Imatch 才 为 真 。 如 果 这 
时 候 按 下 确认 键 ， 密 码 锁 转换 到 打开 (open) 状态 (enter 人 lmatch) ， 密 码 锁 打 开 。 在 打开 状 
态 再 次 输入 确认 键 则 使 密码 锁 返 回 到 复位 状态 。 如 果 在 开始 状态 ， 当 密码 长 度 不 匹配 时 按 下 确 


认 键 (输入 的 密码 位 数 过 多 或 过 少 ) (enter 人 lmatch) ， 则 密码 锁 状 态 转换 为 wait2 状态 。 

密码 锁 数据 通路 部 分 的 框图 如 图 16-30 所 示 。 数 据 通路 包括 两 个 独立 的 部 分 。 上 半 部 分 用 
于 比较 输入 密码 的 长 度 和 密码 值 。 下 半 部 分 用 于 输入 错误 密码 时 定义 等 竺 周期 。 此 部 分 包含 一 
个 单独 的 定时 器 模块 ， 当 控制 信号 load 有 效 时 载 入 定时 间隔 twait。 然 后 定时 器 开始 倒计时 。 当 
定时 器 计时 结束 时 ， 状 态 信号 done 变 为 有 效 。 

数据 通路 的 上 半 部 分 包含 一 个 计数 器 、 一 个 ROM 和 两 个 比较 器 。 计 数 器 记录 我 们 正在 输 
入 的 密码 数位 。 在 密码 锁 进 入 开始 状态 之 前 计数 器 清 零 ， 然 后 在 每 次 有 密码 键 按 下 时 进行 加 一 
计数 。 计 数 器 的 输出 信号 index 选择 将 要 进行 比较 的 密码 数位 。 信 号 index 和 length 进行 比较 生 
成 状态 信号 lmatch, index 还 用 于 表示 存放 密码 的 ROM 的 地 址 。 密 码 的 当前 数 数位 从 ROM 
内 读 出 ， 作 为 信号 code， 同 用 户 输 入 的 按键 进行 比较 ， 生 成 状态 信号 kmatch。 图 16-31 和 
图 16-32 给 出 了 密码 锁 的 Verilog 程序 实现 。 在 这 里 我 们 将 控制 模块 和 数据 通路 模块 都 放 在 了 
一 个 单独 的 模块 中 。 这 样 做 省 略 了 将 控制 部 分 和 数据 部 分 进行 连接 的 代码 ， 但 是 对 于 大 模块 来 
说 可 能 导致 不 够 灵活 、 不 易 维 护 的 编程 代价 。 





图 16-29 ”密码 锁 控 制 部 分 状态 图 
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ke’ 







kmatch 


Imatch 


图 16-30 ”密码 锁 数 据 通 路 部 分 的 框图 


此 模块 的 数据 通路 部 分 如 图 16-31 所 示 。 该 Verilog 程序 严格 按照 图 16-30 给 出 的 框图 进行 
编写 。 计 数 器 用 的 是 16. 1. 2 节 介绍 的 加 一 / 减 一 / 载 入 计数器。 在 这 里 只 用 到 了 rst 和 up 两 
个 控制 输入 信和 号。 其 他 控制 输入 信号 load 和 down 都 为 零 。 当 对 计数 器 进行 综合 时 ， 综 合 器 
将 利用 这 些 零 控 制 输入 信和 号 来 消除 无 用 的 逻辑 电路 。16. 1. 3 节 介 绍 的 定时 器 模块 用 来 在 wait2 
状态 时 进行 倒计时 。 两 个 比较 器 用 assignment 语句 实现 。 








ff/ 
// CombLock 

// 输入 信号: 

// key 一 一 4 位 信号 ， 当 key_valid 有 效 时 每 次 接收 一 位 密码 

// key_valiqd 一 一 接收 新 密码 位 的 标识 信号 

// ”enter 一 一 表示 全 部 密码 输入 完毕 的 信号 


// 输出 信号: 
// busy 一 一 超时 输入 错误 密码 后 有 效 
// unlock 一 一 输入 正确 密码 并 按 下 确认 键 后 该 信号 有 效 


module CombLock(clk, rst, key, key valid, enter, busy, unlock) ; 
parameter n = 4 ; // 密码 长 度 位 数 
parameter m= 4 ; // 定时 器 位 数 
input clk, rst, key_valid, enter ; 
input [3:0] key ; 
output busy, unlock ; 


E =3* GREELY, Sasam osne nas sveneenssnesaneeensssesss 
wire rstctr ; // 计数 器 复位 

wire inc ; // 计数 器 加 计数 

wire load; // 载 入 定时 器 

wire done ; // 定时 结束 

wire [n-1:0] index ; 

wire [3:0] code ; 

UDL_Count #(n) ctr(clk, rstctr, inc, 1’b0, 1'b0, 4’bO, index) ; // 计数 器 
ROM #(n,4) rom(index, code) ; // ROM 存 储 密码 

Timer #(m) tim(clk, rst, load, ‘TWAIT, done) ; // 等 待定 时 器 
wire kmatch = (code == key) ; // 密码 比较 器 

wire lmatch = (index == ‘LENGTH) ; // 长 度 比较 器 








图 16-31 密码 锁 的 Verilog 描述 (两 部 分 中 的 第 一 部 分 ) 。 此 部 分 紧 随 图 16-30 对 数据 通路 进 
行 描述 
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图 16-32 显示 了 密码 锁 模块 的 Verilog 实现 的 控制 部 分 程序 。 程 序 的 顶部 生成 输出 和 下 一 个 
状态 变量 。 输 出 信号 busy 和 unlock 通过 对 状态 变量 state 进行 译 码 来 产生 ， 这 是 由 于 这 
两 个 输出 信号 在 密码 锁 处 于 wait2 状态 和 打开 状态 时 相应 的 值 都 为 真 。 开 始 状态 和 waitl 状态 也 
进行 了 译 码 ， 在 命令 方程 式 中 会 用 到 。 命 令 信 号 rstctr 用 于 在 复位 时 重 置 数 位 计数 器 ， 或 者 
在 指向 开始 状态 的 那些 状态 (wait 状态 和 打开 状态 ) 时 重 置 计数 器 ， 以 便于 计数 器 完成 清 零 
工作 ,准备 在 开始 状态 统计 数位 序列 。 同 样 ，1oad 信和 号 在 指向 wait2 状态 (开始 状态 和 waitl 
RE) 的 状态 时 载 入 定时 器 ， 以 便于 在 wait2 状态 时 能 够 进行 倒计时 。 在 开始 状态 下 每 次 有 键 
按 下 时 ，inc 信号 对 计数 器 进行 加 一 计数 。 

下 一 个 状态 函数 通过 casex 语句 实现 ， 并 用 一 个 单独 的 assign 语句 复位 到 开始 状态 。 
case 变量 由 5 个 输入 信号 和 状态 信和 号 拼接 而 成 ， 该 状态 信号 用 当前 状态 影响 下 一 个 状态 函数 。 


//--- 
































控制 器 


wire [‘SWIDTH-1:0] state, next ; // 当前 状态 和 下 一 个 状态 
reg [‘SWIDTH-1:0] nextl ; // 复位 

wire senter = (state == ‘ENTER) ; // 译 码 状态 

assign unlock = (state == ‘OPEN) ; 

assign busy = (state == ‘WAIT2) ; 

wire swaitl = (state == ‘WAIT1) ; 

assign rstctr = rst | unlock | busy ; // 返回 到 输入 状态 之 前 复位 
assign inc = senter & key valid ; // 每 次 有 按键 时 进行 加 计数 
assign load = senter | swaitl ; // 在 进入 wait2 状 态 之 前 载 入 


DFF #(‘SWIDTH) sr(clk, next, state) ; // 状态 寄存 器 


always @(*) begin 
casex({enter, lmatch, key valid, kmatch, done,state}) 


{5’bxx10x, ‘ENTER}: nextl = ‘WAIT1 ; // valid & ~kmatch 
{5'b0x11x, ‘ENTER}: nextl = ‘ENTER ; // valid & kmatch 
{5’b110xx, ‘ENTER}: nextl = ‘OPEN ; // enter & lmatch 
{5’b10xxx,‘ENTER}: nextl = ‘WAIT2 ; // enter & ~lmatch 
{5'bOx0xx, ‘ENTER}: nextl = ‘ENTER ; // “enter & “valid 








{5'blxxxx,‘OPEN}: nextl = ‘ENTER ; // enter 
{5’bOxxxx, ‘OPEN}: nextl = ‘OPEN ; // “enter 
{5'bixxxx, ‘WAIT1}: nextl = ‘WAIT2 ; // enter 
{5'bOxxxx, ‘WAIT1}: nexti = ‘WAIT1 ; // "enter 
{5'bxxxx1l,‘WAIT2}: nextl = ‘ENTER ; // done 
{5‘bxxxx0,‘WAIT2}: nextl = ‘WAIT2 ; // “done 
default: nextl = {‘SWIDTH{1’bx}}; 
endcase 
end 
assign next = rst ? ‘ENTER : nextl ; // 复位 
endmodule 





图 16-32 密码 锁 的 Verilog 描述 (两 部 分 中 的 第 二 部 分 )。 此 部 分 描述 控制 器 。 
assign 语 句 生成 命令 和 输出 信号 。casex 语句 计算 下 一 个 状态 函数 


图 16-33 给 出 了 用 一 系列 测试 输入 对 密码 锁 模块 进行 仿真 生成 的 波形 图 。 该 测试 访问 到 了 
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所 有 状态 ， 并 且 遍 历 了 图 16-29 所 示 的 状态 图 的 所 有 边 。 该 测试 通过 三 次 开锁 尝试 进行 测试 ， 
其 中 包括 一 次 正确 尝试 两 次 错误 尝试 。 复 位 以 后 ,测试 过 程 首先 输入 正确 的 密码 序列 ， 在 1 和 
7 之 后 分 别 给 出 一 个 脉冲 。 循 环 输入 直到 输入 最 后 一 个 数值 8 ， 按 下 确认 键 enter， 下 一 个 周 
期 unlock 信号 变 为 高 电 平 ， 密 码 锁 进入 打开 状态 (state =-1), enter 信号 在 保持 一 个 周 
期 低 电 平 之 后 又 变 为 高 电 平 ， 使 密码 锁 返 回 开 始 状 态 。 
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图 16-33 图 16-31 和 图 16-32 所 描述 的 密码 锁 模块 的 仿真 波形 


第 二 次 开锁 尝试 包含 了 输入 无 效 密码 。 当 输入 第 一 个 错误 密码 位 时 (7 代替 了 8) ， 密 码 锁 
装 换 到 waitl WAS (state =2)。 密 码 锁 保持 wil 状态 直到 确认 键 enter 按 下 ， 然 后 进入 
wait2 状态 (state =3)。 在 wait2 KAS, 输出 信号 busy 有 效 ， 定 时 器 从 4 开始 倒计时 。® 

第 三 次 开锁 尝试 包含 输入 错误 长 度 的 密码 。 正 确 输 入 第 一 个 密码 位 后 ， 按 下 确认 键 ，en- 
ter 信号 有 效 。 由 于 输入 的 密码 还 没 达到 正确 长 度 (lmatch = 9), 密码 锁 转 换 到 wait2 状态 
并 开始 对 定时 器 进行 倒计时 。 


小 结 


在 本 章 中 ， 通 过 学 习 将 系统 划分 为 数据 通路 和 控制 逻辑 的 过 程 ， 你 已 经 迈 出 了 从 模块 设计 
到 系统 设计 的 第 一 步 。 还 学 习 了 如 何 设计 数据 通路 FSM， 它 的 状态 机 的 下 一 个 状态 函数 由 表达 
式 描述 ， 而 不 是 状态 表 。 

常用 的 数据 通路 FSM 包括 计数 器 和 移 位 寄存 器 。 计 数 器 由 当前 状态 增加 或 减少 来 生成 下 
一 个 状态 。 移 位 寄存 器 通过 对 当前 状态 进行 移 位 来 产生 下 一 个 状态 。 这 些 FSM 还 可 能 具有 为 
状态 寄存 器 载 入 一 个 任意 值 的 功能 。 

大 多 数 系统 能 够 划分 为 数据 通路 和 控制 逻辑 两 部 分 。 数 据 通 路 维护 状态 信息 ， 这 些 状态 表 


















































日 ”实际 上 我 们 可 以 用 更 长 的 超时 时 间 。 然 而 ,用 短 的 超时 时 间 可 以 缩短 仿真 时 间 ， 从 而 使 得 波形 图 的 可 读 性 
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示 为 值 ， 就 像 自 动 售 货 机 中 找 零 的 数量 ,或 者 音频 信号 的 量 级 。 数 据 通 路 的 下 一 个 状态 函数 由 
表达 式 定义 ,或 者 在 结构 上 直接 连接 多 路 选择 器 和 功能 单元 。 

相应 的 ， 控 制 逻辑 维护 的 状态 表示 离散 的 操作 模式 。 数 据 通 路 的 操作 用 框图 或 者 表达 式 表 
示 ， 而 控制 逻辑 的 操作 用 状态 图 或 状态 表 表 示 。 


习题 

16.1 环形 计数 器 。 考 虑 一 个 具有 4 位 状态 寄存 器 state 的 数据 通路 FSM， 其 下 一 个 状态 函数 由 以 下 
Verilog 语句 进行 描述 : 
wire [3:0] next = rst ? 0 : {state[2:0],~state[3]} ; 


画 出 该 FSM 的 状态 图 。 用 简单 的 语言 描述 此 FSM 能 完成 的 功能 。 
16.2 线性 反馈 移 位 寄存 器 ，I。 .考虑 一 个 具有 4 位 状态 寄存 器 state 的 数据 通路 FSM， 其 下 一 个 状态 
函数 由 以 下 Verilog 语句 进行 描述 : 


wire [3:0] next = rst ? 4'b1 : {state[2:0],state[3]^state[2]} ; 


回想 一 下 ， 在 Verilog 语言 中 表示 XOR 操作 。 画 出 该 FSM 的 状态 图 。 用 简单 的 语言 描述 此 FSM 能 
完成 的 功能 。 

16.3 ”线性 反馈 移 位 寄存 器 ，I[。 考 虑 一 个 具有 5 位 状态 寄存 器 state 的 数据 通路 FSM， 其 下 一 个 状态 
函数 由 以 下 Verilog 语句 进行 描述 : 


wire [4:0] next = rst ? 5'bl : {state[3:0] ,state[4] state[2]) ; 
回想 一 下 ， 在 Verilog 语言 中 “表示 XOR 操作 。 画 出 该 FSM 的 状态 图 。 用 简单 的 语言 描述 此 FSM 能 
完成 的 功能 。 


16.4 饱和 计数 器 ，I。 画 出 计数 器 的 框图 ， 该 计数 器 可 以 加 计数 、 减 计数 、 载 人 。 然 而 ， 该 计数 器 必须 
在 加 计数 (从 可 编程 的 最 大 值 开始 ) 和 减 计 数 ( 从 零 开始 ) 时 必须 进行 饱和 计数 。 

16.5 ”饱和 计数 器 ，I。 为 习题 16.4 中 的 饱和 计数 器 编写 Verilog 程序 。 

16.6 多 路 计数 器 ，I。 修改 图 16-9 中 的 加 一 / 减 一 / 载 入 计数 器 ， 使 修改 后 的 计数 器 含有 4 个 独立 的 计数 
寄存 器 。 增 加 一 个 两 位 输入 信和 号 rd， 用 于 在 进行 任何 给 定 操作 时 选择 修改 4 个 计数 寄存 器 中 的 哪 
= 

16.7 多 路 计数 器 ，[[。 修 改 习 题 16. 6 中 的 计数 器 ， 使 得 修改 后 的 计数 器 有 一 个 源 寄存 器 输入 rs 和 一 个 
目的 寄存 器 输入 rd。 这 样 允 许 用 户 设置 cnt3 = cnt0 -1， 例 如 (rd=3, rs=0)。 用 rd 输入 作为 载 人 
的 目的 。 

16.8 裴 波 那 契 数列 ，I。 画 出 计算 16 位 斐 波 那 契 数列 的 数据 通路 电路 的 框图 。 每 个 时 钟 周期 电路 输出 
下 一 个 斐 波 那 契 数 (复位 以 后 从 0 开始 ) 。 当 下 一 个 数 大 于 16 位 时 ， 电 路 应 发 出 信和 号 。 

16.9 裴 波 那 契 数列 H. H] Verilog 编程 实现 习题 16. 8 中 的 数据 通路 FSM, 

16.10 自动 售 货 机 ,I。 按 以 下 方式 修改 16. 3. 1 节 中 的 自动 售 货 机 。 当 把 硬币 投入 售 货 机 中 时 ,适当 的 
信号 保持 不 定时 间 的 高 电 平 。 只 需要 对 每 个 硬币 进行 一 次 计数 ， 在 投入 下 一 个 硬币 之 前 输入 信号 
变 为 低 电 平 。 

16.11 自动 售 货 机 ，I。 按 以 下 方式 修改 16. 3. 1 节 中 的 自动 售 货 机 。 如 果 用 户 不 断 向 当前 实现 的 售 货 机 
投入 硬币 ， 则 计数 器 会 溢出 。 设 计 自 动 售 货机 具有 最 高 收 款 数 ， 使 得 将 多 出 的 硬币 退还 给 用 户 。 

16.12 密码 锁 ，I。 按 以 下 方式 修改 16. 3.2 节 中 的 密码 锁 。 增 加 密码 锁 功能 使 该 密码 锁 支持 多 用 户 (最 
多 8 个 )。 第 一 位 数字 选择 用 户 ， 其 他 输入 信息 为 开锁 序列 。 所 有 编码 都 存放 在 同一 个 单独 的 
ROM 中 。 

16.13 密码 锁 ， I。 按 以 下 方式 修改 16.3.2 节 中 的 密码 锁 。 人 允许 用 户 (单一 用 户 ) 输入 的 密码 中 有 一 
位 错误 时 仍然 能 够 开锁 。 例 如 ， 如 果 密 码 是 12345， 以 下 任何 一 组 输入 都 能 够 开锁 : 11345. 
12385 、12349。 对 于 长 度 为 n 的 密码 ， 在 原始 的 实现 方法 和 宽松 的 实现 方法 中 猜 对 正确 组 合 的 概 
率 是 多 少 ? 
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16. 15 


16. 16 
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16. 20 
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16. 22 








番茄 重量 ，I。 KAMRE BB eA, BORAT RR 16 teal Rin, AG 
Hi 4 ~6 ter), A Ae aR 3 个 或 4 个 番茄 。 接 下 来 的 三 个 问题 要 求 我 们 创建 一 个 模块 ， 
按 顺 序 接收 每 个 番茄 的 重量 ， 并 为 每 个 包装 输出 总 重量 和 一 个 表示 打包 有 效 的 信号 。 所 设计 系统 
的 输入 信号 为 rst (清除 重量 ) clk, weight [2: 0] (当前 番茄 的 重量 ) valid in ( 输 
人 的 重量 是 有 效 的 ) 。 当 存储 的 重量 数值 (输出 信号 weight_out[4:0]) 为 16 或 者 大 于 16 时 
输出 信号 valid_ out 出 现 上 升 沿 。 在 表示 番茄 重量 大 于 16 准 司 的 有 效 输出 信号 之 后 ， 下 一 个 
输入 重量 应 该 加 0， 表示 开始 新 的 一 个 包装 。 画 出 该 模块 的 数据 通路 的 框图 。 

香 茄 重量 ,I。 为 习题 16.14 中 创建 的 数据 通路 描述 如 何 生成 控制 信号 〈 用 逻辑 方程 式 或 框图 
表示 ) 。 

番茄 重量 ,I。 编 程 实现 习题 16. 14 中 的 番茄 称 重 器 ， 并 进行 验证 。 

计算 器 FSM，I。 八 进 制 计 算 器 的 数据 通路 包含 一 个 24 位 输入 寄存 器 in_ reg 和 一 个 24 位 累加 
器 acc。 这 两 个 寄存 器 的 内 容 都 以 8 位 八进制 (基数 为 8) 数字 表示 。 复 位 的 时 候 两 个 寄存 器 都 
清 零 。 计 算 器 包含 按键 C ( 清 零 ) 、 数 字 键 0 ~7、 功 能 键 + 、- 、x 。 按 下 一 次 按键 C 表示 清除 
in_ reg, 再 次 按 下 按键 C 并 且 中 间 没 有 其 他 按键 时 表示 清除 acc。 按 下 数字 键 时 将 in reg 
寄存 器 内 容 左 移 三 位 并 将 按键 的 数字 填充 到 寄存 器 空 出 的 低 三 位 。 按 下 功能 键 时 在 两 个 寄存 器 之 
间 执 行 该 功能 ， 并 将 执行 结果 存 人 acc 中 。 画 出 该 计算 器 数据 通路 的 框图 。 

计算 器 FSM，HI。 画 出 习题 16. 17 介绍 的 计算 器 的 控制 器 模块 的 框图 。 

计算 器 FSM，II。 编 写 Verilog 程序 实现 习题 16. 17 中 的 计算 器 。 编 写 测试 平台 验证 计算 器 的 Ver 
ilog 程序 。 

计算 器 FSM，IV。 结 合 框 图 ， 用 英语 进行 描述 ， 说 明 为 了 使 计算 器 能 够 接收 十 进 制 输入 (数字 
0-9) 来 代替 八进制 数 ， 必 须 对 前 边 的 设计 进行 哪些 修改 。 每 个 数字 必须 进行 单独 存储 和 显示 ， 
也 就 是 说 ， 需 要 一 个 类 似 习题 6. 14 中 的 七 段 数码 管 显示 那样 的 模块 来 完成 。 

升序 序列 检测 器 。 编 写 Verilog 模块 ， 在 8 位 输入 端 in 接收 8 字 节 序列 ， 该 序列 第 一 个 字 节 由 信 
号 位 start 标识 。 所 设计 的 模块 需要 在 最 后 一 个 字 节 输入 完成 后 的 周期 声明 一 个 信号 位 done. 
在 同一 个 周期 还 需要 声明 一 个 信号 位 in_sequence 来 表示 此 8 字 节 序列 是 否 为 升序 序列 ， 也 就 
是 说 , 第 i+1 个 字 节 比 第 i 个 字 节 大 1, bi =b, +1, i 从 1 到 7。 

降序 序列 检测 器 。 编 写 Verilog 模块 ,在 8 位 输入 端 in 接收 8 字 节 序列 ， 该 序列 第 一 个 字 节 由 信 
号 位 start 标识 。 所 设计 的 模块 需要 在 最 后 一 个 字 节 输入 完成 后 的 周期 声明 一 个 信号 位 done, 
在 同一 个 周期 还 需要 声明 一 个 信号 位 in_sequence 来 表示 此 8 字 节 序列 是 否 为 降序 序列 ， 也 就 
是 说 , 第 i+1 个 字 节 比 第 i 个 字 节 小 1, bi =6,-1, i 从 1 到 7。 
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分 解 有 限 状 态 机 





分 解 状态 机 是 将 状态 机 划分 为 两 个 或 更 多 简单 状态 机 的 过 程 。 可 以 通过 将 状态 机 的 正 交 垂直 
部 分 划分 成 能 够 独立 处 理 的 单独 的 FSM， 从 而 大 大 简化 状态 机 的 设计 。 独 立 的 FSM 之 间 通 过 逻辑 
信号 进行 通信 。 一 个 FSM 为 男 一 个 FSM 提供 输入 控制 信号 并 检测 它 的 输出 状态 信和 号。 如果 通过 
分 解 问题 ， 对 状态 机 进行 适当 的 分 解 ， 就 可 以 使 状态 机 更 加 简单 并 且 易 于 理解 和 维护 。 

在 FSM 分 解 过 程 中 ， 每 个 子 状态 机 的 状态 表示 多 维 状 态 空间 中 的 一 维 。 所 有 子 状 态 机 的 
状态 共同 定义 整体 状态 机 的 状态 一 一 状态 空间 中 的 一 个 独立 的 点 。 组 合 后 的 状态 机 有 一 定数 量 
的 状态 ， 这 个 数量 等 于 各 个 子 状态 机 状态 的 乘积 一 状态 空间 中 的 点 的 数量 .2 如 果 单 个 状态 
机 有 几 十 个 状态 ， 整 个 状态 机 有 成 千 上 万 个 状态 就 不 足 为 怪 了 。 如 果 不 进 行 分 解 来 处 理 这 么 大 
数目 的 状态 将 是 不 切实 际 的 。 

在 16. 3 节 我 们 已 经 看 到 了 一 种 分 解 的 形式 ， 即 开发 一 个 包含 数据 通路 组 件 和 控制 组 件 的 
状态 机 。 实 际 上 ， 我 们 将 整个 状态 机 分 解 为 数据 通路 部 分 和 控制 部 分 。 在 此 我 们 通过 介绍 如 何 
对 控制 部 分 进行 分 解 来 推广 这 个 概念 。 

在 本 章 中 ， 我 们 通过 两 个 实例 来 介绍 有 限 状 态 机 分 解 。 在 第 一 个 例子 中 ， 我 们 从 一 个 平面 
FSM 开始 将 其 分 解 为 多 个 简单 的 FESM。 在 第 二 个 例子 中 ， 我 们 直接 从 规格 中 得 到 分 解 后 的 
FSM ， 而 不 受 平面 FSM 的 干扰 。 大 多 数 真 实 的 FSM 用 后 一 种 方法 进行 设计 。 分 解 通常 是 状态 
机 规格 的 自然 产物 。 很 少 应 用 到 已 知 平面 状态 机 中 。 

17. 1 闪光 信号 灯 

假设 要 设计 一 个 闪光 人 信号灯。 发光 器 有 单独 的 输入 信号 in 和 单独 的 输出 信号 out。 当 输入 
信号 in 变 为 高 电 平时 (保持 一 个 周期 ) ， 初 始 化 闪烁 序列 。 当 闪烁 序列 通过 out 信和 号 输出 时 ， 
驱动 一 个 发 光 二 极 管 (LED) 闪烁 3 次 。 对 于 每 次 闪烁 ， 输 出 信号 out 保持 6 个 周期 高 电 平 
(LED 开 ) 。 在 闪烁 之 间 输 出 信号 out 保持 4 个 周期 低 电 平 。 第 三 次 闪烁 之 后 FSM 返回 OFF 状 
态 等 待 输入 信号 in 的 下 一 个 脉冲 到 来 。 

闪光 信号 灯 的 状态 图 如 图 17-1 所 示 。 该 FSM 包含 27 个 状态 : 3 次 闪烁 每 次 包含 6 MRA, 
每 次 闪烁 之 间 的 两 个 阶段 包含 4 个 状态 ， 还 有 一 个 OFF 状态 。 我 们 可 以 用 一 条 包含 27 种 假设 
的 case 语句 实现 此 FSM。 但 是 ,假如 设计 规格 变 成 了 要 求 每 次 闪烁 包含 12 个 周期 、4 个 闪烁 
周期 和 7 个 闪烁 间隔 周期 。 由 于 该 状态 机 是 平面 状态 机 ， 这 些 改动 任何 一 个 都 需要 完全 改变 
case 语句 。 

我 们 将 阐述 闪光 信号 灯 的 分 解 过 程 。 该 状态 机 可 以 按 两 种 方式 进行 分 解 。 首 先 ， 我 们 可 以 
将 打开 和 关闭 时 间 间 隔 的 计数 进行 析出 因数 ， 作 为 一 个 定时 器 。 这 样 可 以 将 给 定 闪 烁 或 内 烁 间 
隔 的 6 状态 或 4 状态 序列 缩减 为 一 个 单独 状态 。 这 样 进 行 定 时 分 解 不 但 简化 了 状态 机 ， 而 且 使 
得 改变 打开 和 关闭 时 间 间 隔 变 得 相当 简单 。 第 二 种 方法 ,将 三 次 闪烁 进行 析出 因数 (虽然 最 后 
一 次 闪烁 略 有 不 同 ) 。 这 样 做 也 简化 了 状态 机 ， 还 使 得 我 们 可 以 改变 闪烁 次 数 。 

图 17-2 显示 了 发 光 器 如 何 通过 分 解 将 计算 时 间 间 隔 的 过 程 分 离 为 单独 的 状态 机 。 如 图 17-2b 
所 示 ， 分 解 后 的 状态 机 包含 一 个 主 FSM 和 一 个 定时 器 FSM， 主 FSM 用 于 接收 in 信号 并 生成 out 





加 ”对 于 大 多 数 状 态 机 来 说 ， 并 不 是 状态 空间 中 所 有 点 都 是 可 到 达 的 。 
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图 17-1 闪光 信号 灯 的 状态 图 


信和 号。 定时 器 FSM 接收 来 自主 FSM 的 两 个 控制 信号 ， 并 返回 一 个 状态 信和 号。 控制 信号 tload fy 
令 定 时 器 为 倒计时 器 载 入 一 个 值 〈 即 开启 倒计时 ) ， 信 和 号 tsel 用 于 选择 要 载 人 的 数值 。 当 tsel 
为 高 电 平 时 ， 定 时 器 设置 为 计数 6 个 周期 。 当 tsel 为 低 电 平时 ， 计 数 器 计数 4 个 周期 。 当 计数 
器 完成 倒计时 计数 时 ， 信 号 done 有 效 ， 并且 保持 有 效 状态 直到 计数 器 重新 载 和 数值。 该 定时 
器 的 状态 图 如 图 17-2c 所 示 。? 此 定时 器 作为 一 个 数据 通路 FSM 来 实现 ， 具 体 在 16. 1. 3 节 进 行 
讨论 。 

主 FSM 的 状态 图 如 图 17-2a 所 示 。 这 些 状态 与 图 17-1 中 状态 完全 对 应 ， 只 是 将 每 个 重复 
状态 序列 (如 Al 到 A6) 用 一 个 单独 的 状态 (H A) 代替 。 状 态 机 从 OFF 状态 启动 。 该 状态 
不 断 为 启动 序列 (tsel =1) 载 入 定时 器 的 倒计时 数值 。 当 信和 号 in 有效 时 ，FSM 进入 状态 A， 输 
出 信号 out 变 为 高 电 平 ， 定 时 器 开始 倒计时 。 主 FSM 保持 状态 A， 等 待定 时 器 计时 完成 ， 信 和 号 
done 有 效 。 该 状态 保持 6 个 周期 。A 状态 的 最 后 一 个 周期 ， 信 号 done 变 为 真 ， 因 此 tload 信和 号 
有 效 (iload = done) ， 并 且 计数 器 载 人 关闭 序列 的 倒计时 值 (tsel =0)。 注 意 ， 只 有 在 A 状态 最 
后 一 个 周期 ，done 信号 有 效 时 ，tload 信号 才 有 效 。 如 果 该 信号 在 A 状态 每 个 周期 都 有 效 ， 则 
定时 器 将 不 断 复位 ， 并 且 永 远 不 会 到 达 DONE 状态 。 由 于 done 信号 在 最 后 一 个 周期 有 效 ， 状 
态 机 在 下 一 个 周期 进入 状态 B 并 且 输 出 信和 号 out 变 为 低 电 平 。 该 过 程 在 状态 B 到 下 之 间 不 断 重 
A, 在 每 次 进行 状态 转换 时 都 要 等 待 信号 done 有 效 。 这 些 状态 中 的 每 一 个 (E 状态 除外 ) 都 
在 其 最 后 一 个 周期 通过 指定 tload = done 来 为 下 一 个 状态 载 人 计数 值 。 

如 果 将 图 17-2 的 FSM 同 图 17-1 的 平面 FSM 进行 比较 ， 我 们 发 现 平面 状态 机 的 状态 被 分 开 
了 。 在 当前 闪烁 或 内 烁 间隔 表示 循环 计数 的 一 部 分 状态 〈 状 态 名 称 的 数字 部 分 或 在 图 17-1 中 
的 水 平 位 置 ) 包含 在 计数 器 中 ， 而 反映 当前 所 处 哪 一 次 闪烁 或 内 烁 间隔 的 一 部 分 状态 CARAS 


日 ”该 状态 图 只 显示 了 tload 信号 在 状态 DONE 时 的 活动 情况 。 实 际 上 ， 定 时 器 可 以 在 任何 状态 下 进行 载 人 。 为 了 
表示 清楚 ， 在 这 里 省 略 了 额外 的 边 。 
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名 称 的 字母 部 分 或 在 图 17-1 中 的 垂直 位 置 ) 包含 在 主 FSM 中 。 通 过 这 种 方式 将 状态 分 解 成 水 
平和 垂直 两 部 分 ， 从 而 可 以 只 用 两 个 6 状态 状态 机 就 能 够 表示 原始 状态 机 的 所 有 27 个 状态 。 


in done done done done done 


ta) tload= 1 tload = done tload = done tload = done tload = done 
tsel = 1 tsel = 0 tsel = 1 tsel = 0 tsel = 1 
out = 0 out = 1 out = 0 out =1 out = 0 





b) 





tload load a tsel 






9 


tload a tsel 


图 17-2 ”闪光 信号 灯 的 状态 图 ， 将 打开 和 关闭 时 间 间 隔 提取 因数 为 一 个 定时 器 。a) E FSM 的 状 
态 图 。b) E FSM 和 定时 器 FSM 进行 连接 的 框图 。e) 定时 器 FSM 的 状态 图 


图 17-2a HE FSM 的 Verilog 程序 如 图 17-3 所 示 。flash 模块 实例 化 了 一 个 状态 寄存 器 和 
一 个 定时 器 〈 见 图 17-4) ， 然 后 用 一 个 case 语句 描述 组 合 逻 辑 表示 的 下 一 个 状态 和 输出 逻辑 。 
对 于 6 个 状态 中 的 每 一 个 状态 ， 都 用 一 条 连接 语句 对 输出 信号 out 、 两 个 定时 器 控制 信号 
tload 和 tsel、 下 一 个 状态 next1 进行 设置 。 需 要 注意 的 是 ， 分 配给 定时 器 控制 信号 
tload 的 值 取 决 于 定时 器 状态 done 信号 的 值 。 这 是 一 个 输入 信号 done 不 经 过 延迟 直接 影响 
输出 信号 tload 的 状态 机 的 实例 。 在 每 一 个 状态 ， 下 一 个 状态 由 ? :语句 决定 ， 在 进入 下 一 个 
状态 之 前 要 等 待 信号 in 或 信号 done 有 效 。 最 后 的 assign 语句 将 状态 机 复位 到 OFF 状态 。 


// 为 Elash1 定 义 状态 

‘define SWIDTH 3 

‘define S OFF 3’b000 // off 状 态 

‘define SA 3’b001 // 第 一 次 闪烁 

‘define SB 3’b010 // 第 一 个 闪烁 间隔 
‘define SC 3'b011 // 第 二 次 闪烁 

‘define SD 3'b100 // 第 三 个 闪烁 间隔 
‘define SE 3'b101 // 第 三 次 和 最 后 一 次 闪烁 








// Flash 一 一 闪烁 3 次 ， 每 次 6 个 周期 闪烁 ，4 个 周期 停止 。 每 次 in 有 效 


module Flash(clk, rst, in, out) ; 


图 17-3 图 17-2a 中 主 FSM 的 Verilog 描述 
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input clk, rst, in ; // 训 触 发 器 启动 闪烁 序列 

output out ; // out 驱 动 LED 

reg out ; // 输出 

wire [‘SWIDTH-1:0] state, next ; // 当前 状态 

reg [‘SWIDTH-1:0] nextl ; // 不 含 复 位 的 下 一 个 状态 
reg tload, tsel ; // 定时 器 输入 信和 号 
wire done ; // 定时 器 输出 信和 号 

// 实例 化 状态 寄存 器 

DFF #(‘SWIDTH) state_reg(clk, next, state) ; 





// 实例 化 定时 器 


Timerl timer(clk, rst, tload, tsel, done) ; 


// 下 一 个 状态 和 输出 逻辑 
always @(*) begin 
case (state) 
‘S OFF: (out, tload, tsel, next1} = 
{i’b0; Lrbl: iibi, in ? SS Á > ‘S_OFF } ; 





‘S.A: (out, tload, tsel, next1} = 

{1'b1, done, 1’b0, done ? 'S B: 'SA } ; 
`S B: (out, tload, tsel, next1) = 

(1:b0, done, 1’b1, done ? ‘SC: 'S_B ) ; 
iS C: (out, tload, tsel, next1) = 

{1'b1, done, 1'b0, done ? ‘SD: ‘SC ) ; 
`S D: (out, tload, tsel, nexti} = 

{1'b0, done, 1’b1, done ? 'S E : 'S_D ) ; 
`S E: (out, tload, tsel, next1) = 


{1'b1, done, 1’b1, done ? 'S_OPF : ‘SE } ; 
default:{out, tload, tsel, next1} = 
(1'b1, done, 1’b1, done ? ‘S OFF : ‘SE } ; 
endcase 
end 


// 重 置 到 关闭 状态 
assign next = rst ? ‘S_OFF : nextl ; 
endmodule 





17-3 (22) 


为 了 保证 程序 的 完整 性 ， 定 时 器 的 Verilog 程序 如 图 17-4 所 示 。 所 采用 的 方法 同 16. 1.3 节 
介绍 的 方法 类 似 。 

对 图 17-2 所 示 分 解 的 发 光 器 进行 仿真 得 到 的 波形 显示 如 图 17-5 所 示 。 从 顶部 开始 第 4 行 
的 输出 信号 显示 预期 的 3 个 脉冲 ， 每 个 脉冲 宽度 为 6 个 周期 ， 闪 烁 间隔 为 4 个 周期 。 主 FSM 的 
状态 直接 在 输出 信号 下 边 显 示 ， 定 时 器 状态 显示 在 图 的 底部 。 波 形 显 示 了 主 FSM 如 何在 定时 
器 倒计时 时 一 一 闪烁 时 从 5 倒 计 到 0， 闪 烁 间隔 时 从 3 倒 计 到 0 一 一 保持 在 一 个 状态 不 变 。 定 
时 器 控制 信号 线 (直接 位 于 定时 器 状态 上 边 ) 显示 了 在 状态 A~E (1-5) 时 tload 信号 如 
何 紧 随 done 信号 。 
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// 定义 时 间 间 隔 

// RAS, 用 5 到 0 表示 6 个 周期 时 间 间 隔 
‘define T WIDTH 3 

‘define T ON 3’d5 

‘define T OFF 3'd3 





// 定时 器 1 一 一 复位 到 完成 状态 。tload 有 效 时 载 入 时 间 
// 如 果 tsel 有 效 则 载 入 T_ON， 否 则 载 入 T_OFF。 如 果 没 有 载 入 或 复位 状态 ， 定 时 器 开始 
// 每 个 周期 进行 计时 。done 有 效 并 生计 数 器 为 0 时 停止 定时 
module Timerl(clk, rst, tload, tsel, done) ; 
parameter n=‘T_ WIDTH ; 
input clk, rst, tload, tsel ; 
output done ; 
wire [n-1:0] count ; 


reg [n-1:0] next_count ; 


// 状态 寄存 器 


DEF #(n) state(clk, next_count, count) ; 





// ë # done 


assign done = ~(|count) ; 


// 下 一 个 计数 逻辑 
always@(*) begin 
casex({rst, tload, tsel, done}) 





4'bixxx: next_count = ‘T_WIDTH’bO ; 

4'b011x: next_count = ‘T_ON ; 

4'b010x: next_count = `T OPF ; 

4'b00x0: next count = count - 1'bh1 ; 

4'b00x1: next count = count ; 

default: next_count = count ; 
endcase 





end 
endmodule 


图 17-4 图 17-2 所 示 闪 光 信 号 灯 所 用 定时 器 FSM 的 Verilog 描述 


我 们 可 以 通过 将 状态 AL C. 认定 为 重复 相同 功能 来 对 发 光 器 进一步 进行 分 解 。 唯 一 的 
不 同 就 是 剩余 闪烁 的 次 数 。 我 们 可 以 将 剩余 闪烁 的 次 数 分 解 为 第 二 个 计数 器 ， 如 图 17-6 所 示 。 
在 这 里 主 FSM 只 有 三 个 状态 决定 状态 机 是 关闭 、 闪 烁 还 是 闪烁 间隔 。 决 定 闪 烁 或 闪烁 间隔 的 
内 部 位 置 的 状态 包含 在 一 个 定时 器 中 (就 像 图 17-2 所 示 ) 。 最 后 ， 决 定 剩余 闪烁 次 数 的 状态 包 
含 在 一 个 计数 器 中 。 主 FSM、 定 时 器 FSM 和 计数 器 FSM 三 个 FSM 共同 决定 分 解 后 的 状态 机 的 
全 部 状态 。 三 个 子 状态 机 中 的 每 一 个 分 别 决 定 三 维 状态 空间 中 沿 着 一 个 轴 的 状态 

进行 二 次 分 解 的 状态 机 的 主 FSM 的 状态 图 如 图 17-6b 所 示 。 状 态 机 只 有 三 个 状态 
OFF 状态 启动 。 在 OFF 状态 ， 定 时 器 和 计数 器 都 进行 载 人 。 nie ATONE. 1 
器 载 人 比 实 际 需要 的 闪烁 次 数 少 一 的 值 ( 即 对 于 4 次 闪烁 计数 器 载 和 数值 3) 。 输 入 信和 号 in 变 
SARE PAPAL A MAMRE, 2 FLASH IRAE, MIES oct 2521, SIRDIR 
时 ， 计 数 器 空闲 。 在 FLASH 状态 的 最 后 一 个 周期 ， 定 时 器 倒计时 到 0 状态 ,信号 tdone HH. 
在 这 个 周期 ， 定 时 器 重新 载 人 闪烁 间隔 的 倒计时 值 。 在 tdone 信号 为 真 时 ， 如 果 计 数 器 没有 完 
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图 17-5 对 图 17-2 中 分 解 的 闪光 信号 灯 进 行 仿真 的 波形 图 
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成 计数 (cdone 不 为 真 )， 则 FSM 从 FLASH 状态 转换 为 SPACE 状态 。 和 否则 ， 如 果 这 是 最 后 一 次 
闪烁 (cdone 为 真 ) ， 状 态 机 返回 到 OFF 状态 。 在 SPACE 状态 ， 输 出 信号 为 假 ， 定 时 器 进行 倒 
计时 ， 计 数 器 空闲 。 在 SPACE 状态 的 最 后 一 个 周期 ，tdone 信和 号 为 真 。 这 使 得 计数 器 减 一 ， 减 
少 剩余 闪烁 次 数 的 值 ， 定 时 器 重新 载 人 闪烁 的 倒计时 值 。 

17-6 中 二 次 分 解 的 闪光 灯 的 Verilog 程序 如 图 17-7 所 示 ， 计 数 器 模块 的 Verilog 描述 见 
图 17-8。 主 FSM 的 下 一 个 状态 和 输出 函数 再 次 使 用 连接 语句 通过 一 条 语句 设置 下 一 个 状态 、 
输出 和 4 个 控制 信号 。 艇 套 的 ? : 语句 用 于 为 FLASH 状态 计算 下 一 个 状态 时 同时 测试 taone 
和 cdone 两 个 信号 。 在 某 些 状态 下 ， 状 态 信 号 tdone 直接 传递 到 控制 信号 tload 和 cdec。 
计数 器 模块 和 定时 咒 模 块 几乎 完全 相同 ， 只 是 有 一 些 控 制 上 的 不 同 ,计数器 只 有 在 cdec 信号 
有 效 时 才 进 行 减 一 操作 ， 而 定时 器 是 一 直 在 进行 减 一 操作 。 概 括 起 来 说 ， 就 是 同一 个 参数 化 的 
模块 可 以 用 于 两 种 不 同 的 功能 。 












tload = tdone tload = tdone 
tsel = 0 tsel = 1 
cload = 0 cload = 0 
cdec = 0 cdec = tdone 
out =1 out = 0 


tsel=1 
cload = 1 
cdec = 0 

out = 0 





图 17-6 对 图 17-1 PRA SATE i. RAP ERE AE PS R 
余 闪 烁 次 数 包 含 在 计数 器 中 。 最 后 ， 闪 光 灯 是 关闭 、 内 烁 还 是 在 两 次 闪烁 之 间 的 间 
隔 由 主 FSM 决定 。a) 二 次 分 解 状态 机 的 框图 。b) E FSM 的 状态 图 





// 定义 二 次 分 解 状态 
‘define XWIDTH 2 
‘define X_OFF 2'b00 
‘define X_FLASH 2’b01 
‘define X_SPACE 2'b10 


module Flash2(clk, rst, in, out) ; 


input clk, rst, in ; // in 触 发 器 启动 闪烁 序列 





output out ; // out 了 驱动 LED 

reg out ; // 输出 

wire [‘XWIDTH-1:0] state, next ; // 当前 状态 

reg [‘XWIDTH-1:0] nextl ; // 不 含 复位 状态 的 下 一 个 状态 





reg tload, tsel, cload, cdec ; // 定时 器 和 计数 器 输入 信号 
图 17-7 图 17-6 中 主 FSM 的 Verilog 描述 
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wire tdone, cdone ; // 定时 器 和 计数 器 输出 信和 号 


// 实例 化 状态 寄存 器 
DFF #(*XWIDTH) state_reg(clk, next, state) ; 


// 实例 化 定时 器 和 计数 器 
Timerl timer(clk, rst, tload, tsel, tdone) ; 
Counterl counter(clk, rst, cload, cdec, cdone) ; 


always @(*) begin 
case (state) 

‘X OFF: (out, tload, tsel, cload, cdec, next1} 
(1750, 3750, blr Ibi, abo, 
in ? *X_FLASH : ‘X_OFF } ; 

‘X FLASH: {out, tload, tsel, cload, cdec, next1} 
{1’b1, tdone, 3'b0, 1’b0, 1’b0, 
tdone ? (cdone ? ‘X_OFF : ‘X_SPACE) : ‘X_FLASH } ; 

‘X_SPACE: {out, tload, tsel, cload, cdec, next1} = 
{1’b0, tdone, 1’b1, 1’b0, tdone, 
tdone ? ‘X_FLASH : ‘X_SPACE } ; 

default:{out, tload, tsel, cload, cdec, next1i} = 
{1'b0, tdone, 1’b1, 1’b0, tdone, 
tdone ? ‘X FLASH : ‘X_SPACE } ; 


endcase 
end 


assign next = rst ? ‘X OFF : nextl ; 
endmodule 











图 17-7 (48) 








// 定义 脉冲 计数 器 
// 4 个 脉冲 载 入 3 
‘define C_WIDTH 2 
‘define C_COUNT 3 


// 计数 器 1 一 脉冲 计数 器 

// ”cload 一 一 载 入 计数 器 值 C_COUNT 
// ”cdec 一 一 计数 值 不 为 0 就 进行 减 计数 
// ”cdone 一 一 计数 值 为 0 的 信和 号 








module Counterl(clk, rst, cload, cdec, cdone) ; 
parameter n=‘C WIDTH ; 
input clk, rst, cload, cdec ; 
output cdone ; 
wire [n-1:0] count ; 
reg [n-1:0] negt count ; 
wire cdone ; 





FA 17-8 图 17-6 中 计数 器 的 Verilog 描述 
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| // 状态 寄存 器 


DFF #(n) state(clk, next_count, count) ; 


// 信和 号 done 


assign cdone = ~(|count) ; 


// 下 一 个 计数 逻辑 


always@(*) begin 









casex({rst, cload, cdec, cdone} ) 
‘C_WIDTH’bO ; 
‘C_COUNT ; 
count = 1'b1 ; 
count ; 


4'blxxx: next_count 
4'b01xx: next count 
4’b0010: next count 
4'b00x1: next_count 


default: next_count count ; 
endcase 
end 


endmodule 








图 17-8 ( 续 ) 


对 二 次 分 解 的 闪光 信号 灯 进 行 仿真 得 到 的 波形 如 图 17-9 所 示 。 在 这 个 仿真 过 程 中 ,计数 
器 初始 化 为 3， 表 示 主 FSM 进行 4 次 闪烁 。 显 而 易 见 ，3 个 状态 变量 的 时 间 尺 是 不 同 的 。 计 数 
器 (最 底部 的 线 ) 移动 的 最 慢 ， 在 4 次 闪烁 序列 中 从 3 减 计 数 到 0。 该 计数 器 在 每 个 闪烁 间隔 
的 最 后 一 个 周期 进行 减 一 计数 。 在 每 个 时 间 点 上 ， 它 表示 完成 当前 闪烁 之 后 剩余 闪烁 的 次 数 。 
E FSM 状态 变化 也 很 慢 。 从 0 (oFF) 状态 启动 后 , 在 1 (FLASH) 状态 和 2 (SPACE) 状态 
之 间 轮 流 替 换 ， 直 到 4 次 闪烁 都 完成 为 止 。 最 后 ， 定 时 器 状态 变化 最 快 ， 每 次 闪烁 时 从 5 倒 计 
时 到 0， 每 次 闪烁 间隔 从 3 倒计时 到 0。 


17.2 交通 灯 控 制 器 


作为 分 解 的 第 二 个 实例 ， 我们 考虑 14. 3 节 介 绍 过 的 交通 灯 控 制 器 的 更 复杂 的 版 本 。 该 状 
态 机 包含 两 个 输入 信号 carew 和 carlt， 分 别 表示 在 东西 方向 马路 上 有 车 等 待 (ew) 以 及 在 左 转 
车 道 有 车 等 待 (lt) 。 此 状态 机 有 9 条 输出 信和 号 线 驱 动 三 组 灯 ， 每 组 包含 三 塌 灯 。 南 北方 向 马 
路 、 东 西方 向 马路 、 左 转车 道 (南北 方向 ) SAAN KR. BAN AABN, — AA 
KT Fl— HERIT o 

通常 南北 方向 的 灯亮 绿灯 。 然 而 ， 当 东西 方向 马路 上 或 左 转车 道上 有 车 等 待 时 ， 我 们 希望 
切换 灯 的 状态 以 便 东西 方向 或 左 转车 道 的 灯 变 为 绿灯 (根据 优先 级 左 转车 道 优先 )。 一旦 灯 切 
换 到 东西 方向 或 者 左 转车 道 ， 灯 将 保持 这 个 状态 直到 该 方向 不 再 监测 到 有 车 等 待 ， 或 者 计时 器 
过 期 。 然 后 灯 的 状态 返回 到 南北 方向 亮 绿 灯 。 

每 次 切换 灯 的 状态 时 ,活跃 方 向 的 灯 从 绿灯 切换 到 黄 灯 。 经 过 一 定时 间 后 再 变 为 红 灯 。 然 
后 ， 经 过 第 二 次 时 间 间 隔 ， 再 将 其 他 方向 的 灯 切 换 为 绿灯 。 直 到 绿灯 保持 了 第 三 次 时 间 间 隔 之 
后 才 允 许 进行 再 次 切换 。 

给 定 这 个 规格 之 后 ,我 们 决定 对 此 有 限 状 态 机 进行 分 解 ， 用 5 个 模块 实现 此 交通 灯 控 制 
器 ， 如 图 17-10 所 示 。 主 FSM 接收 输入 信号 并 决定 哪个 方向 应 该 亮 绿 灯 ， 即 信号 air 的 值 。 
为 了 决定 什么 时 候 该 将 灯 强 制 切换 回 南北 方向 ， 使 用 了 定时 器 Timerl 。 它 还 从 组 合 器 模块 接收 
信号 ok 的 值 ， 表 示 最 后 一 个 方向 的 序列 变化 完成 ， 可 以 开始 新 的 方向 变化 。 

组 合 器 模块 维护 当前 方向 状态 ， 并 将 当前 方向 状态 和 来 自 灯 光 FSM 的 light 信号 组 合 起 来 
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次 分 解 的 闪光 信号 灯 进 行 仿真 的 波形 图 


图 17-9 图 17-6 中 
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生成 9 个 灯光 输出 信号 lights。 组 合 器 模块 还 通过 信和 号 dir ME FSM 模块 接收 方向 请 求 ， 并 且 通 
过 灯光 FSM 序列 对 这 些 请 求 作 出 响应 。 当 有 新 的 方向 请 求 发 生 时 ,组 合 器 解除 警报 信号 on 
(将 其 设置 为 低 电 平 ) 来 要 求 灯光 FSM 将 灯 切 换 到 红 灯 。 当 灯光 为 红 灯 时 ， 当 前 方向 设置 为 等 
同 于 所 请 求 方向 ，on 信号 有 效 来 请 求 灯光 按 序 变 为 绿灯 。 只 有 来 自 灯 光 FSM 的 信号 done 有 
效 之 后 ， 表 示 序 列 完 成 ， 灯 光 已 经 持续 了 要 求 的 时 间 间 隔 的 绿灯 状态 ，ok 信号 有 效 ， 人 允许 另 
一 个 方向 变化 。 

这 些 模块 说 明了 两 种 类 型 的 关系 。 主 FSM 和 组 合 器 模块 形成 一 个 管道 。 请 求 流 从 左 到 右 
经 过 该 管道 。 请 求 信 号 转换 成 car_ew 和 car_lt 输入 的 形式 输入 到 主 FSM 中 。 主 FSM 处 理 该 请 
求 ， 并 转 而 通过 信号 线 dir 给 组 合 器 发 送 一 个 请 求 。 组 合 器 依次 处 理 该 请 求 ， 在 lights 信号 输出 
端 输 出 合适 的 序列 作为 回应 。 我 们 将 在 第 23 章 对 管道 进行 更 加 深入 的 讨论 。 

在 这 里 ok 信号 是 流 控制 信号 的 实例 。 该 信号 为 主 FSM 提供 了 反 压 ， 避 人 免 主 FSM 超前 于 组 
合 器 和 灯光 FSM 模块 。 主 FSM 发 出 一 个 请 求 ， 在 ok 信号 有 效 之 前 不 允许 发 出 其 他 请 求 ，ok 信 
号 有 效 表示 其 他 电路 已 经 完成 处 理 第 一 个 请 求 。 我 们 将 在 22.1.3 节 中 更 加 详细 地 讨论 流 控制 
问题 。 

图 17-10 中 其 他 模块 之 间 的 关系 为 主 从 关系 。 主 FSM 作为 Timerl 的 主 设备 ， 发 送 给 Timerl 
命令 ，Timerl 作为 从 设备 ， 接 受 来 自主 FSM 的 命令 并 执行 这 些 命 令 。 类 似 地 ， 组 合 器 是 灯光 
FSM 的 主 设备 ， 而 灯光 FSM 是 Timer2 的 主 设备 。 

灯光 FSM 使 得 交通 灯 按 序 从 绿灯 变 为 红 灯 然 后 再 变 为 绿灯 。 该 模块 通过 信号 on 从 组 合 器 
模块 接收 请 求 ， 并 通过 done 信号 对 这 些 请 求 作出 回应 。 该 模块 还 生成 3 位 light 信和 号， 表示 当 
BT SCOT. “Sas on 设置 为 高 电 平时 ,请求 灯光 FSM 将 light 信和 号 切换 到 绿灯 。 切 换 
完成 之 后 ， 并 且 最 小 绿灯 时 间 间 隔 到 期 灯光 FSM 模块 将 done 信和 号 设 为 有 效 状 态 作 为 响应 。 
当 信号 on 设置 为 低 电 平时 ,请 求 灯光 FSM 将 light 信号 按 序 切换 到 红 灯 一 一 经 过 黄 灯 状态 并 且 
遵循 要 求 的 时 间 间 隔 。 完 成 请 求 之 后 ，done 信号 设置 为 低 电 平 。 灯 光 FSM 用 它 自己 的 定时 器 
(Timer2 ) 计算 灯光 序列 要 求 的 时 间 间 隔 。 f 

作为 灯光 FSM 和 组 合 器 之 间 的 接口 ， 信 号 done 提供 了 流 控制 功能 。 组 合 器 模块 只 有 在 
done 信和 号 为 低 电 平时 才能 触发 on 信和 号 为 高 电 平 ， 只 有 在 done 信号 为 高 电 平时 才能 触发 on 信和 号 
为 低 电 平 。 信 号 on 触发 之 后 ， 只 有 等 到 信号 done 切换 到 同 信号 on 一样 的 状态 之 后 才能 对 信号 
on 再 一 次 进行 状态 切换 。 


Car_ew 






图 17-10 分 解 交通 灯 控 制 器 的 框图 
= FSM 的 状态 图 如 图 17-11 所 示 。 状 态 机 从 NS 状态 启动 。 在 此 状态 ，Timerl 进行 载 人 操 
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作 ， 以 便于 在 LT 状态 和 Ew 状态 能 够 进行 倒计时 ， 请 求 的 方向 是 NS。 当 信和 号 ok 指示 可 以 请 
求 一 个 新 的 方向 ， 并 且 其 中 一 个 ear 信和 号 指示 另外 ok & (Icar_It | tdone) 
一 个 方向 上 有 车 等 待 ， 这 时 候 退 出 NS 状态 。 在 
EW 状态 和 LT 状态 ， 新 的 方向 有 请 求 时 ， 当 ok 
信号 为 真 ， 并 且 或 者 在 该 方向 上 没有 车 辆 等 待 或 
者 定时 器 计时 时 间 到 (用 信号 tdone 表示 )， 这 时 
候 退 出 当前 状态 。 

灯光 FSM 是 一 个 简单 的 灯光 序列 发 生 器 ， 类 
似 于 17. 1 节 中 的 闪光 信号 灯 。 图 17-12 显示 了 灯 
光 FSM 的 状态 图 。 像 闪光 信号 灯 一 样 ， 在 每 个 状 i 
态 的 最 后 一 个 周期 定时 器 载 人 下 一 个 状态 的 超时 = 
时 限 。 状 态 机 从 RED 状态 启动 。 当 定时 器 定时 结 
束 时 ， 并 且 来 自 组 合 器 的 信号 on 表明 请 求 绿 灯 点 
亮 时 ， 状 态 转 换 为 CREEN 状态 。 在 CREEN 状态 
定时 器 完成 倒计时 之 后 ，done 信号 有 效 。 到 _ 
YELLOW 状态 的 转换 由 定时 器 定时 结束 和 信号 om ETU 图 17-10 的 主 FSM 的 状态 图 
为 低 电 平 来 进行 触发 从 YELLOW 状态 到 RED 状态 的 转换 只 依赖 于 定时 器 。 信 和 号 done 在 
YELLOW 状态 时 保持 高 电 平 。 只 有 在 RED 状态 的 定时 器 完成 倒计时 之 后 ,信号 done 才 人 允许 变 
为 低 电 平 ， 表 示 完 成 了 到 RED 状态 的 转换 。 





tdone 







tdone & on tdone & !on 


light = RED light = GREEN light = YELLOW 
tload = tdone & on tload = tdone & !on tload = tdone 
time = T_GREEN time = T_YELLOW time = T_RED 
done = !tdone done = tdone done = 1 


图 17-12 图 17-10 的 灯光 FSM 状态 图 


分 解 的 交通 灯 控 制 器 的 主 FSM 的 Verilog 描述 如 图 17-13 所 示 。 此 模块 实例 化 了 一 个 定时 
器 ， 然 后 用 case 语句 实现 了 一 个 三 状态 FSM， 此 FSM 严格 按照 图 17-11 中 的 状态 图 实现 。 
Verilog 条 件 语句 “? :” 用 于 生成 下 一 个 状态 逻辑 。 三 层 散 套 选 择 语句 用 在 状态 M_NS 时 依次 
测试 信号 ok, car lt, car_ew. 

E FSM 没有 实例 化 组 合 器 。 主 模块 和 组 合 器 模块 都 在 顶层 设计 中 作为 对 等 模块 进行 实 
例 化 。 

组 合 器 模块 的 Verilog 描述 如 图 17-14 所 示 。 此 模块 从 主 FSM 模块 接收 信号 dir， 用 流 控制 
信号 ok 对 主 FSM 模块 进行 响应 ， 并 生成 输出 信号 1ights。 在 组 合 器 模块 中 状态 的 关键 部 分 
是 当前 方向 寄存 器 cur_Gir。 该 寄存 器 保存 了 灯光 FSM 当前 按 顺 序 排列 的 方向 。 当 信号 on 
和 信号 done 都 为 低 电 平时 ， 该 寄存 器 通过 请 求 方向 信号 dir 进行 更 新 。 当 组 合 器 已 经 请 求 灯 
光 序 列 为 红 灯 (信号 on 为 低 电 平 ) 并 且 灯 光 PSM 已 经 完成 此 请 求 操作 (信号 done 为 电 平 ) 
时 ， 对 此 寄存 器 进行 更 新 。 

任何 时 候 ， 只 要 当前 方向 和 请 求 方向 相 匹配 ， 请 求 灯 光 FSM 将 灯光 定 序 为 绿灯 的 on 命令 


O ”由 于 信号 on 只 有 在 信号 done 为 高 电 平时 才 会 变 为 低 电 平 ， 因 此 信和 号 tdone 的 检测 是 多 余 的 。 
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都 有 效 。 当 主 FSM 请 求 一 个 新 的 方向 时 ， 使 得 on 信号 变 为 低 电 平 ， 表 示 请 求 灯光 FSM 将 灯光 
定 序 为 红 灯 以 便 为 新 的 方向 做 准备 。 


// 主 FSM 状 态 

// 这 些 也 用 作 方 向 值 
‘define MWIDTH 2 
‘define M NS 2'b00 
‘define M_EW 2'b01 
‘define M_LT 2'b10 








// EFSM 

// ”car_ew 一 一 东西 方向 道路 上 有 车 辆 等 待 
// ”car_1lt 一 一 左 转车 道 有 车 辆 等 待 

// ok 信号 ok 有 效 表示 可 以 请 求 新 的 方向 
// ”dir 一 一 输出 信号 表示 新 请 求 的 方向 


module TLC Master(clk, rst, car ew, car_ lt, ok, dir) ; 





input clk, rst, car_ew, car lt, ok ; 
output [1:0] dir ; 


wire [‘MWIDTH-1:0] state, next ; // 当前 状态 和 下 一 个 状态 





reg [‘MWIDTH-1:0] mextl ; // 不 含 复 位 状态 的 下 一 个 状态 
reg tload ; // 载 入 定时 器 

reg [1:0] dir ; // 输出 方向 信和 号 

wire tdone ; // 定时 器 完成 


// 实例 化 状态 寄存 器 
DFF #(‘MWIDTH) state_reg(clk, next, state) ; 


// 实例 化 定时 器 
Timer #(‘TWIDTH) timer(clk, rst, tload, ‘T_EXP, tdone) ; 
always @(*) begin 
case (state) 
‘M_NS: {dir, tload, next1} = 
(`M NS, 1’bi, ok ? (car lt ? ‘M_LT 
(car_ew ? ‘M_EW : 'M_NS)) 
: ‘M_NS} ; 
`M_EW: {dir, tload, next1} = 
{*M_EW, 1'b0, (ok & (“car ew | tdone)) ? ‘M_NS : ‘M EW} 
‘M_LT: {dir, tload, next1} = 
('M LT, 1'b0, (ok & (“car ew | tdone)) ? ‘M NS : ‘M LT) 
default: (dir, tload, next1} = 
{*‘M_NS, 1’b0, ‘M_NS} ; 





endcase 
end 
assign next = rst ? ‘M_NS : nextl ; 
endmodule 





图 17-13 ”交通 灯 控 制 器 主 FSM 的 Verilog 描述 
当 信 号 on 和 信号 done 都 为 真 时 ， 对 主 FSM 进行 响应 的 信号 ok 有 效 。 这 发 生 在 灯光 
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FSM 完成 将 请 求 方向 灯光 定 序 为 绿灯 之 后 。 
输出 信号 lights 由 case 语句 进行 计算 ， 当 前 方向 作为 该 case 语句 的 条 件 变 量 。 该 
case 语句 将 来 自 灯 光 FSM 的 输出 信号 Light 插入 当前 方向 对 应 的 位 置 ， 并 将 其 他 方向 设置 


为 红 灯 。 


// 
// 
// 
// 





组 合 器 
dir 一 一 主 FSM 请 求 的 方向 


ok 一 一 对 主 FSM 做 出 的 响应 
lights 控制 交通 灯 的 9 位 信号 {NS, EW, LT} 





module TLC_Combiner(clk, rst, dir, ok , lights) ; 


input clk, rst ; 

input [1:0] dir ; 

output ok ; 

output [8:0] lights ; 

wire done, on ; 

wire [2:0] light ; 

reg [8:0] lights ; 

wire [1:0] cur_dir, next_dir ; 


// SRA RB 
DFF #(2) dir_reg(clk, next dir, cur_dir) ; 


// 灯光 FSM 
TLC Light lt(clk, rst, on, done, light) ; 


// 从 灯光 FSM 请 求 绿灯 状态 ， 直 到 方向 改变 


assign on = (cur dir == dir) ; 





// 灯光 FSM 使 灯 变 为 红 灯 以 后 更 新 方向 信息 


assign next dir = rst ? 2'bO : (( on & “done) ? dir : cur_dir) ; 


// 灯光 FSM 完 成 之 后 ok 信号 有 效 ， 开 始 新 的 改变 


wire ok = on & done ; 


// 根据 信号 cur_dir 和 1ight 得 到 灯光 状态 
always @(*) begin 
case(cur_dir) 
‘M_NS: lights = (light, ‘RED, ‘RED} ; 
‘M_EW: lights = {‘RED, light, ‘RED} ; 
`M LT: lights = {‘RED, ‘RED, light} ; 
default: lights = {'RED, ‘RED, ‘RED} ; 
endcase 
end 


endmodule 





图 17-14 交通 灯 控 制 器 组 合 器 的 Verilog 描述 


灯光 FSM 的 Verilog 描述 如 图 17-15 所 示 。 该 模块 实例 化 了 一 个 定时 器 ， 然 后 用 case 语句 
实现 了 一 个 对 应 图 17-12 所 示 的 状态 转换 的 FSM。 下 一 个 状态 逻辑 用 Verilog 选择 语句 实现 。 
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module TLC Light(clk, rst, on, done, light) ; 
input clk, rst, on j 
output done ; 
output [2:0] light ; 
reg [2:0] light ; 
reg done ; 
wire [‘LWIDTH-1:0] state, next ; // 当前 状态 ， 下 一 个 状态 
reg [‘LWIDTH-1:0] nextl ; // 下 一 个 状态 w/0 复 位 
reg tload ; 
reg [*TWIDTH-1:0] .tin ; 


wire tdone ; 


// 实例 化 状态 寄存 器 
DFF #('`LWIDTH) state reg(clk, next, state) ; 


// 实例 化 定时 器 


Timer timer(clk, rst, tload, tin, tdone) ; 


always @(*) begin 
case (state) 
‘L_RED: {tload, tin, light, done, next1} = 
{tdone & on, ‘T_GREEN, ‘RED, “tdone, 
(tdone & on) ? ‘L_GREEN : ‘L_RED} ; 
‘L_GREEN: {tload, tin, light, done, next1} = 
{tdone & “on, ‘T_YELLOW, ‘GREEN, tdone, 
(tdone & ~on) ? ‘L_YELLOW : ‘L_GREEN} ; 
‘L_YELLOW: {tload, tin, light, done, next1} = 
{tdone, ‘T_RED, ‘YELLOW, 1’b1, tdone ? ‘L_RED : ‘L YELLOW} ; 
default: {tload, tin, light, done, next1} = 
{tdone, ‘T_RED, ‘YELLOW, 1'b1, tdone ? ‘L_RED : ‘L YELLOW} ; 
endcase 
end 


assign next = rst ? ‘L RED : nextl ; 





endmodule 





图 17-15 ”交通 灯 控 制 器 灯光 FSM 的 Verilog 描述 


分 解 的 交通 灯 控 制 器 进行 仿真 的 波形 如 图 17-16 所 示 。 状 态 机 首先 通过 设置 主 FSM 为 NS 
状态 (00) 实现 复位 。 输 出 信号 dir 也 为 NS (00)。 由 于 灯光 FSM 还 没有 完成 排序 使 得 NS Jr 
向 上 亮 绿 灯 ， 因 此 信号 线 ok 初始 化 为 低 电 平 。 交 通 灯 初 始 化 为 全 红 灯 (444 ) ， 但 是 一 个 周期 
之 后 南北 方向 变 为 绿灯 (144). 

灯光 FSM 初始 化 为 RED (00) 状态 ， 由 于 信号 on 和 信号 tdone 都 有 效 ， 因 此 紧 接 着 变 为 
GREEN 状态 。 在 GREEN 状态 启动 一 个 定时 器 ， 发 送信 号 done 到 组 合 器 ， 紧 接着 组 合 器 发 送 
信号 ok 到 主 FSM， 在 这 之 前 tdone 信号 再 次 有 效 。 

由 于 car_ew 有 效 ， 一旦 ok 信号 变 为 高 电 平 ， 主 FSM 通过 设置 dir 为 01 来 请 求 方向 改变 为 
东西 方向 。 组 合 器 通过 设置 on 信和 号 为 低 电 平 来 请 求 灯 光 FSM 排序 当前 方向 的 灯 为 红 灯 ， 以 此 
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作为 对 主 FSM 请 求 的 响应 。 灯 光 FSM 依次 进行 响应 ， 将 状态 转换 到 YELLOW 状态 (10), ü 
将 引起 light 信号 变 为 黄 灯 (2), ， 因 此 lights 信号 变 为 244 ， 即 南北 方向 亮 黄 灯 。 当 灯光 定时 器 
完成 倒计时 ， 灯 光 状 态 机 进入 RED 状态 (00), light 信号 变 为 4 (RED), lights 信号 变 为 444， 
即 所 有 方向 亮 红 灯 。 一 旦 灯光 定时 器 倒计时 结束 ， 即 全 红 灯 状 态 最 小 时 间 结 束 ， 灯 光 FSM 将 
done 信号 设置 为 低 电 平 ， 表 示 已 经 完成 了 状态 转换 。 

当 信 号 on 和 信号 done 都 为 低 电 平时 ， 组 合 器 更 新 信号 cur_dir 为 东西 方向 (01), 设置 信 
号 on 为 高 电 平 用 于 请 求 灯光 FSM 排序 东西 方向 的 灯 为 绿灯 。 当 灯光 FSM 完成 这 些 动作 ， 且 已 
经 为 GREEN 状态 开始 进行 定时 ， 其 将 信号 done 设置 为 真 。 这 将 引起 组 合 器 将 信号 ok WH, 
并 发 送信 号 给 主 FSM 说 明 它 已 经 准备 好 接收 新 的 方向 。 

当 信 号 ok 第 二 次 有 效 时 ， 主 FSM 再 次 请 求 南北 方向 (dir =00)。 这 个 请 求 由 信号 线 car_ 
ew 为 低 电 平 或 者 主 定时 器 定时 结束 来 驱动 。 新 的 方向 请 求 使 得 信号 on 变 为 低 电 平 ， 并 将 所 有 
灯 都 排序 为 红 灯 状 态 。 然 后 ， 信 和 号 cur_dir 更 新 之 后 ,设置 信号 on 为 高 电 平 以 便 将 灯 排 序 为 
GREEN 状态 。 当 这 些 都 完成 之 后 ， 信 和 号 ok 再 次 有 效 。 

当 信和 号 ok 第 三 次 有 效 时 ， 信 号 car_lt 为 真 ， 即 请 求 左 转 方向 (dir = 10) ， 灯 排序 为 变 为 红 
灯 之 后 再 返回 绿灯 状态 。 当 排序 完成 时 ，ok 信号 第 四 次 有 效 。 这 时 car_lt 信和 号 仍然 有 效 ， 但 是 
主 定时 器 已 经 定时 结束 ， 因 此 再 次 请 求 南北 方向 。 


/TestTLC/clk TIT oo 
/TestTLC/rst/ | 

/TestTLC/car ew| | + | | 

/TestTLC/car_lt, 

/TestTLC/ights-( {144 24a gaa} [414 424 ya! pa | P44 A 1441 a2 yaaa | E 
/TestTLC/ok | | | | ] | 

/TestTLC/dir-{00 | O t = m 

Master State+0 |] | 0 " | 
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图 17-16 ”分解 交通 灯 控 制 器 仿真 的 波形 图 


























小 结 


在 本 章 中 通过 两 个 实例 ,学习 了 如 何 将 复杂 有 限 状 态 机 进行 分 解 ， 划 分 为 多 个 简单 的 状态 
机 。 将 状态 机 进行 分 解 ， 即 将 一 个 巨大 的 一 维 状态 空间 映射 到 一 个 多 维 状态 空间 ， 用 分 解 后 的 
每 个 状态 机 表示 其 中 一 维 。 

合并 相同 状态 序列 是 分 解 的 一 种 方法 。 如 果 一 个 状态 图 中 完全 相同 (或 几乎 完全 相同 ) 
的 序列 出 现 多 次 ， 则 此 序列 可 以 进行 因 式 提取 。 用 一 个 状态 机 实现 相同 序列 ， 另 一 个 状态 机 保 
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持 记录 当前 正在 运行 哪 一 个 重复 序列 的 实例 ， 以 便于 在 序列 结束 时 能 够 转换 到 正确 的 状态 。 内 
光 信 号 灯 的 例子 就 是 通过 识别 相同 序列 的 方法 进行 分 解 。 

分 层 是 进行 分 解 的 另外 一 种 方法 ， 用 这 种 方法 可 以 构建 分 层次 的 状态 机 。 项 层 状态 机 作出 
顶层 决策 ， 如 ， 哪 个 方向 应 该 亮 绿 灯 ， 并 保持 顶层 状态 。 顶 层 状 态 机 调用 一 个 或 多 个 低层 状态 
机 来 执行 其 指令 ， 就 像 对 交通 灯 进 行 排序 使 得 其 从 绿灯 变 为 红 灯 ， 反 之 亦 然 。 低 层 状态 机 可 以 
调用 它们 自己 的 伺服 程序 状态 机 ， 例 如 定时 器 。 为 了 使 不 同 层次 的 状态 机 操作 能 够 同步 ， 需 要 
加 入 流 控 制 功能 。 


习题 
17. 1 对 状态 图 进行 分 解 ， I-I, 思考 图 17-17 所 示 的 状态 图 。 


x=01 x=11 


x=00 x=01 gall 





图 17-17 习题 17. 1 未 分 解 的 状态 图 。 该 状态 图 有 一 个 一 位 信号 m， 输 出 一 个 两 位 信号 x。 
没有 标明 输入 值 的 边 表示 自动 进行 状态 转换 


(a) 识别 此 FSM 中 的 完全 相同 或 几乎 完全 相同 的 状态 序列 。 
(b) 画 出 实现 这 些 状态 序列 的 单独 FSM 的 状态 图 ， 输入 信号 应 该 从 序列 变化 的 部 分 中 选择 。 
(e) 画 出 改进 的 顶层 状态 图 ， 用 于 调用 (b) 中 的 FSM 来 实现 重复 序列 。 

17.2 对 状态 图 进行 分 解 ，1 - 芽 。 用 Verilog 编程 实现 习题 17. 1 中 分 解 的 状态 机 。 

17.3 对 状态 图 进行 分 解 ， 开 -I。 思 考 图 17-18 所 示 的 状态 图 。 
(a) 识别 此 FSM 中 的 完全 相同 或 几乎 完全 相同 的 状态 序列 。 
(b) 画 出 实现 这 些 状态 序列 的 单独 FSM 的 状态 图 ， 输入 信号 应 该 从 序列 变化 的 部 分 中 选择 。 
(e) 画 出 改进 的 顶层 状态 图 ， 用 于 调用 (b) 中 的 FSM 来 实现 重复 序列 。 








图 17-18 习题 17. 3 未 分 解 的 状态 图 。 该 状态 图 有 一 个 一 位 信号 m， 输 出 一 个 一 位 信号 x. 
没有 标明 输入 值 的 边 表示 自动 进行 状态 转换 


17.4 对 状态 图 进行 分 解 ， - ll. H Verilog 编程 实现 习题 17. 3 中 分 解 的 状态 机 。 

17.5 ”对 状态 图 进行 分 解 ，II -I。 思 考 图 17-19 所 示 的 状态 图 。 
(a) 识别 此 FSM 中 的 完全 相同 或 几乎 完全 相同 并 且 能 够 用 定时 器 代替 的 状态 序列 。 
(b) 画 出 改进 的 顶层 状态 图 ， 用 于 调用 (a) 中 的 定时 器 。 
(c) 识别 新 的 FSM 中 的 完全 相同 或 几乎 完全 相同 的 状态 序列 。 


373 
i 


378 


280 ROBY Pa PEM 








(d) 画 出 实现 这 些 状态 序列 的 单独 FSM 的 状态 图 ， 包括 定时 器 。 
(e) 画 出 改进 的 顶层 状态 图 ， 用 于 调用 (e) 中 的 FSM 来 实现 重复 序列 。 项 层 最 多 包括 5 个 状态 。 








图 17-19 习题 17.5 未 分 解 的 状态 图 。 该 状态 图 有 一 个 一 位 信号 m， 输 出 一 个 两 位 信和 号。 
每 个 状态 用 它们 的 输出 值 (0, 1, 2 或 3) 代替 状态 ID 表示 


17.6 ”对 状态 图 进行 分 解 ，II - I。 用 Verilog 编程 实现 习题 17. 5 中 进行 了 二 次 分 解 的 状态 机 。 

17.7 分 层 状态 机 ,I。 设计 一 个 FSM 用 于 控制 仓库 中 的 自动 叉车 。 仓 库 中 地 面 上 和 通道 中 央 都 画 有 反光 
线 。 反 光线 在 每 个 交叉 点 都 产生 分 支 。 所 有 交叉 点 包括 通道 都 以 90 度 角 相交 。 设 计 的 FSM 有 输 
入 信号 far_left、left、center、right 和 far_right， 表 示 反 光线 严重 偏 左 、 稍 微 偏 左 、 居 中 、 稍 微 偏 
右 、 严 重 偏 右 。 还 有 一 个 输入 信号 meter， 又 车 每 次 移动 一 米 ， 此 信号 就 变 为 高 电 平 并 保持 一 个 周 
期 。FSM 的 输出 信号 go 使 又 车 向 前 移动 ， 信 和 号 turn_right 和 turn_left 使 得 又 车 在 指定 方向 上 改变 5 
度 。 状 态 机 的 每 个 时 钟 周期 叉车 可 以 向 前 移动 大 约 1 em。 放置 传 感 器 以 便于 当 反光 线 接近 又 车 中 
心 时 ， 三 个 中 间 传 感 器 将 会 有 一 个 被 触发 。 如 果 出 现 向 右 的 5 度 航线 偏差 ， 将 使 叉车 在 100 个 周 
期 内 关闭 左 侧 传感器 打开 右 侧 传感器 。 

在 仓库 中 ， 通 过 一 系列 指令 ， 使 又 车 指向 特定 的 位 置 。 有 三 种 类 型 的 指令 : advance n 命令 
叉车 沿 着 当前 反光 条 向 前 移动 n 米 ; advance next 命令 又 车 向 下 一 个 交叉 点 前 进 ，tuzrn <di- 
rection > 命令 又 车 在 当前 交叉 点 转向 指定 的 方向 〈 左 或 右 ) 。 
(a) 描述 叉车 控制 器 FSM 的 层次 。 总 共 分 为 多 少 个 层次 ?每 个 层次 分 别 实现 什么 功能 ? 
(b) 定义 层次 之 间 的 接口 。 画 出 这 些 接口 的 框图 。 
(c) 为 每 个 层次 分 别 画 出 其 FSM, 

17.8 3 ERA, H. FA Verilog 编程 实现 习题 17. 7 中 的 叉车 控制 器 。- 

17.9 反 向 合并 ，I。 在 图 17-2 的 闪光 信号 灯 状 态 机 中 ， 主 状态 机 记录 了 当前 处 于 哪 一 次 闪烁 〈 或 闪烁 
间隔 ) ， 用 一 个 从 定时 器 来 计算 每 次 闪烁 〈 或 内 烁 间隔 ) 中 的 周期 数 。 用 另外 一 种 方法 对 状态 机 
进行 分 解 ， 使 得 主 状态 机 计算 每 次 闪烁 中 的 周期 数 ， 从 状态 机 记录 当前 所 处 的 闪烁 或 闪烁 间隔 。 
(a) 画 出 反 向 闪光 信号 灯 的 框图 。 

(b) 为 主 状态 机 和 从 状态 机 分 别 画 出 状态 图 。 

17.10 反 向 合并 ，I。 用 Verilog 编程 实现 习题 17.9 中 新 的 发 光 器 。 

17.11 SOS 发 光 器 ，I。 修 改 图 17-2 中 的 发 光 器 FSM， 使 它 闪烁 SOS 序列 一 一 3 次 短 闪 烁 (每 次 一 个 时 
钟 周期 ) ， 紧 接着 进行 3 次 长 闪烁 (每 次 4 个 时 钟 周 期 ) ， 然 后 再 进行 3 次 短 闪 烁 。 每 个 字符 之 间 
的 时 间 间 隔 为 一 个 时 钟 周 期 。 一 条 SOS 序列 中 字符 之 间 的 时 间 间 隔 长 度 应 该 为 3 个 时 钟 周期 。 前 
一 条 SOS 序列 和 下 一 条 SOS 序列 之 间 的 时 间 间 隔 应 该 为 7 个 周期 。( 提示: 构建 一 个 字符 FSM 和 
一 个 SOS FSM, ) 

17.12 SOS 发 光 器 ，I。 用 Verilog 编程 实现 习题 17. 11 中 的 SOS 发 光 器 。 要 求实 现 测 试 平台 并 对 设计 进 
行 验证 。 
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17. 13 


17. 14 


17. 15 


17.16 


17.17 


17. 18 


17. 19 


SOS 发 光 器 ，III。 修 改 习 题 17. 11 和 习题 17.12 中 的 SOS 发 光 器 ， 实 现 一 个 FSM 闪烁 莫 尔 斯 码 
(Morse code) 编码 的 TOSS 来 代替 SOS, (T 的 编码 是 一 个 单独 的 长 闪烁 。) 

改进 的 闪光 信号 灯 ，I。 修 改 图 17-6 所 示 的 发 光 器 FSM， 如 果 计 数 为 奇数 则 亮 灯 5 个 时 钟 周 期 ， 
如 果 计 数 为 偶数 则 亮 灯 15 个 周期 。 需 要 提供 一 个 经 过 验证 的 Verilog 模块 作为 解决 方案 。 
改进 的 闪光 信号 灯 ，I。 修 改 图 17-6 Pras BJ AGA FSM， 使 得 灯 持续 点 亮 的 时 间 等 于 当前 计数 
值 。 需 要 提供 一 个 经 过 验证 的 Verilog 模块 作为 解决 方案 。 

步行 、 禁 止步 行 发 光 器 。 编 写 FSM 的 Verilog 程序 ， ART: 步行 灯 和 禁止 步行 〈 停 止 ) 信 
号 灯 。 控 制 输出 的 为 一 个 三 位 独 热 码 输入 信号 cl。 信 号 ctl 可 能 出 现 的 每 种 值 对 应 的 发 光 器 操作 
如 下 所 示 : 3:b001; 步行 -关闭 , 停止- 打开; 3:b010: 步行 -关闭 ,停止 -闪烁 〈10 个 时 钟 周 
期 关闭 ，15 个 时 钟 周期 打开 ); 3:b100: 步行 = 打开 ， 停止 -关闭 。 

交通 灯 控 制 器 ，I。 修 改 图 17-10 中 的 交通 灯 控 制 器 ， 使 得 南北 方向 和 东西 方向 有 相同 的 优先 级 。 
增加 一 个 附加 的 输入 信号 car_ns， 表 示 南 北方 向 有 车 等 待 。 无 论 在 NS 状态 还 是 EW 状态 ， 另 外 
一 个 方向 有 车 等 待 时 就 切换 到 另外 一 个 方向 ， 主 定时 器 结束 定时 。 

交通 灯 控 制 器 ，I。 修 改 图 17-10 中 的 交通 灯 控 制 器 ， 使 得 从 红 灯 切 换 到 绿灯 时 ， 在 切换 之 前 红 
灯 和 黄 灯 都 点 亮 保持 三 个 时 钟 周 期 。 

交通 灯 控 制 器 ，II。 修 改 图 17-10 中 的 交通 灯 控 制 器 ， 使 其 在 南北 方向 和 东西 方向 都 包含 人 行道 
信号 灯 (见习 题 17. 16) 。 灯 的 顺序 不 再 是 绿灯 、 黄 灯 、 红 灯 。 而 是 用 绿灯 步行 、 绿 灯 闪 烁 、 黄 
灯 、 红 灯 这 个 顺序 来 代替 。 步 行 信号 只 能 在 绿灯 步行 灯亮 时 有 效 。 禁 止步 行 灯 应 该 在 绿灯 闪烁 时 
进行 闪烁 ， 在 黄 灯 和 红 灯 状 态 时 禁止 步行 灯 有 效 。 
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Digital Design; A Systems Approach 
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用 存储 阵列 实现 有 限 状态 机 的 下 一 个 状态 和 输出 逻辑 为 实现 FSM 提供 了 一 种 灵活 的 方法 。 
可 以 通过 改变 存储 器 的 内 容 来 改变 FSM 的 功能 。 我 们 所 说 的 存储 阵列 内 容 称 为 微 码 ， 用 这 种 
方法 实现 的 状态 机 称 为 微 编码 FSM。 所 述 存 储 阵列 的 每 个 字 都 决定 了 状态 机 在 特定 状态 和 输入 
信号 组 合 下 的 行为 ， 称 为 微 指 令 。 

通过 增加 用 特定 逻辑 计算 下 一 个 状态 的 存储 器 ， 或 者 通过 有 选择 地 更 新 很 少 发 生变 化 的 输 
出 信号 ， 我 们 可 以 减少 所 需 的 微 指令 存储 器 。 通 过 增加 一 个 指令 序列 发 生 器 和 分 支 微 指令 来 引 
起 控制 流 发 生 改 变 ， 为 每 个 状态 提供 一 条 微 指令 ， 而 不 是 为 每 个 状态 x 输入 信和 号 的 组 合 提供 一 
条 微 指令 。 可 以 通过 定义 控制 、 输 出 以 及 其 他 功能 的 不 同 微 指令 类 型 来 实现 不 同 的 功能 共享 微 
指令 的 数据 位 。 


18.1 简单 的 微 编 码 FSM 


图 18-1 给 出 了 一 个 简单 微 编 码 FSM 的 框图 。 存 储 阵 列 保存 下 一 个 状态 和 输出 函数 。 存 储 
阵列 的 每 一 个 字 保存 了 当前 状态 和 输入 信和 号 的 特定 组 合 所 对 应 的 下 一 个 状态 和 输出 信号 。 存 储 
阵列 通过 当前 状态 和 输入 信和 号 级 联 来 进行 编 址 。 一 对 寄存 器 分 别 保存 当前 状态 和 当前 输出 
信和 号。 





图 18-1 简单 微 编码 FSM 的 框图 


在 实践 中 ,存储 器 可 能 用 RAM 或 EEPROM 来 实现 ， 以 便 允 许 软 件 对 微 码 进行 重新 编程 。 
或 者 ， 存 储 器 可 能 为 ROM。 用 ROM 作为 存储 器 ， 需 要 一 个 新 的 掩 模 组 来 重新 编写 微 码 。 然 
m, KA ROM 的 程序 而 不 用 改变 芯片 布局 ， 这 样 做 仍然 是 有 利 的 。 某 些 ROM 设计 甚至 允许 通 
过 改变 单独 的 金属 级 掩 模 来 改变 程序 ， 这 样 做 节省 了 变更 的 成 本 。 某 些 设计 采用 了 混合 设计 方 
法 ,将 大 多 数 微 码 放 到 ROM 里 (为 了 节约 成 本 )， 将 一 小 部 分 微 码 保 留 在 RAM 里 。 有 一 种 方法 
可 以 将 一 个 任意 状态 序列 重 定向 到 微 码 的 RAM 部 分 ， 从 而 允许 任何 状态 使 用 RAM 进行 修补 。 

该 FSM 的 Verilog 描述 如 图 18-2 所 示 。 该 程序 严格 按照 原理 图 ， 并 添加 了 一 些 逻 辑 电 路 ， 
E rst 信号 有 效 时 进行 状态 复位 。ROM 模块 是 只 读 存储 器 ， 取 走 地 址 (state, in), 返回 
微 指令 uinst。 然 后 微 指令 被 分 解 为 下 一 个 状态 和 输出 组 成 部 分 。 由 于 在 没有 对 ROM 进行 编 
程 之 前 没有 功能 ， 因 此 图 18-1 和 图 18-2 的 FSM 非常 简单 。 

为 了 看 到 如 何 对 ROM 进行 编程 实现 有 限 状 态 机 ， 思 考 14. 3 节 介 绍 的 简单 交通 灯 控 制 器 。 
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图 18-3 再 一 次 给 出 了 此 控制 器 的 状态 图 。 为 了 填充 微 码 ROM， 简 单 写 出 每 个 当前 状态 /输入 信 
号 组 合 情 况 下 ， 下 一 个 状态 和 输出 信号 的 值 ， 如 表 18-1 所 示 。 思 考 表格 的 第 一 行 。 地 址 0000 
对 应 输入 信号 car_ew =0 时 的 状态 GNS (南北 方向 亮 绿 灯 )。 对 于 此 状态 ,输出 信号 为 100001 
(南北 方向 亮 绿灯 ， 东 西方 向 亮 红 灯 )， 并 且 下 一 个 状态 为 GNS (000)。 因 此 ，ROM 中 0000 位 
置 的 内 容 为 000100001 ， 即 下 一 个 状态 000 和 输出 信号 级 联 的 结果 。 表 格 的 第 二 行 ， 地 址 0001 
对 应 输入 信号 car_ew = 1 时 的 状态 GNS。 在 这 里 输出 信号 同 第 一 行 相 同 , 但 是 下 一 个 状态 为 
YNS (001) ， 因 此 ROM 存储 器 此 位 置 的 内 容 为 001100001。 表 格 剩 下 的 行 可 以 用 类 似 的 方式 推 
导出 来 。 用 名 为 “数据 ”的 列 的 内 容 对 ROM 进行 加 载 。 


module ucodel(clk,rst,in,out) ; 
parameter n= 1 ; // 输入 信号 宽度 
parameter m = 6 ; // 输出 信号 宽度 
parameter k = 3 ; // 状态 位 数 








input clk, rst ; 
input [n-1:0] in ; 
output [m-1:0] out ; 


wire (k-1:0] next, state ; 
wire [k+m-1:0] uinst ; 


DFF #(k) state_reg(clk, next, state) ; // 状态 寄存 器 

DFF #(m) out_reg(clk, uinst[m-1:0], out) ; // 输出 寄存 器 
ROM #(n+k,m+k) uc({state, in}, uinst) ; // 微 码 存储 

assign next = rst ? {k{1’b0}} : uinst[m+k-1:m] ; // 重 置 状态 
endmodule 








图 18-2 简单 微 编码 FSM 的 Verilog 描述 


car_ew 


100001 010001 001100 001010 





output 


gyr gyr 
ns ew 


图 18-3 简单 交通 灯 控 制 器 的 状态 图 


用 表 18-1 中 的 ROM 内 容 对 图 18-2 所 示 的 微 编码 FSM 进行 仿真 的 结果 如 图 18-4 所 示 。 输 
出 信和 号、 状态 、 微 码 ROM 地 址 、 微 码 ROM 数据 ( 微 指令 )( 底 部 的 4 个 信号 ) 用 八进制 表示 
(基数 为 8) 。 系 统 初始 化 为 状态 0 (GNS) 并 且 输 出 信号 为 41 (南北 方向 亮 绿 灯 (4) ， 东 西方 
向 亮 红 灯 (1) ) 。 然 后 输入 信号 线 (car_ew) 变 为 高 电 平 ， 将 ROM 地 址 从 00 切换 到 01。 这 使 
得 微 指令 从 041 切换 到 141 ， 在 下 一 个 时 钟 选择 下 一 个 状态 为 1 (YNS) 。 然 后 状态 机 在 返回 到 
状态 0 之 前 先 经 过 状态 2 (CEW) 和 状态 3 (YEW). 
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Be 18-1 简单 微 编码 交通 灯 控 制 器 的 状态 表 


地 址 状态 car_ew 下 一 个 状态 输出 数据 
0000 GNS (000) 0 GNS (000) 100001 000100001 


































0001 GNS (000) l YNS (001) 100001 001100001 
0010 YNS (001) 0 GEW (010) 010001 | 010010001 
0011 YNS (001) 1 GEW (010) 010001 010010001 
0100 GEW (010) 0 YEW (011) 001100 011001100 
0101 GEW (010) l YEW (011) 001100 011001100 








0110 0 GNS (000) 001010 000001010 

微 码 的 优点 在 于 ， 我 们 可 以 仅仅 改变 ROM 的 内 容 来 改变 FSM 的 功能 。 例 如 ， 假 设 我 们 想 
要 对 FSM 进行 如 下 修改 : 

1) 只 要 信号 car_ew 为 真 ， 东 西方 向 灯 就 保持 亮 绿 灯 ; 

2) 南北 方向 绿灯 至 少 持续 亮 3 个 周期 (状态 GNS1 、GNS2 和 GNS3) ; 

3) 黄 灯 之 后 ， 每 个 方向 的 灯 都 变 为 红 灯 ， 并 且 至 少 保持 一 个 周期 ， 之 后 再 开始 新 的 绿灯 
点 亮 周期 。 

表 18-2 给 出 了 完成 这 些 改 动 的 状态 表 。 将 状态 GNS 划分 为 三 个 状态 ， 并 增加 两 个 新 状态 
(RNS 和 REW) 。 注 意 状 态 GEW 现在 对 信号 car_ew 进行 测试 ， 并 且 该 信号 为 真 时 一 直 保 持 
GEW 状态 。 用 新 的 微 码 对 图 18-2 的 PSM 进行 仿真 的 结果 见 图 18-5 所 示 的 波形 。 


表 18-2 简单 微 编码 交通 灯 控制 器 的 状态 表 














0000 GNS1 (000) GNS2 (001) 100001 001100001 
0001 GNSI (000) GNS2 (001) 100001 | 001100001 
0010 GNS2 (001) GNS3 (010) 100001 | 010100001 
0011 GNS2 (001) GNS3 (010) 100001 010100001 








0100 GNS3 (010) 0 100001 010100001 
0101 GNS3 (010) 1 ; 100001 011100001 
a TT 
0111 YNS (011) I 010001 100010001 




























1000 RNS (100) 0 GEW (101) 001001 101001001 
== 

1001 RNS (100) 1 GEW (101) 001001 101001001 

1010 GEW (101) 0 YEW (110) 001100 110001100 


1011 GEW (101) GEW (101) 001100 101001100 


1100 YEW (110) 001010 111001010 
1101 YEW (110) 














111001010 
1110 REW (111) 000001001 
1111 REW (111) 000001001 
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图 18-4 ”用 表 18-1 中 的 微 码 对 图 18-2 的 微 编码 FSM 进 行 仿真 的 波形 图 
图 18-5 ”用 表 18-2 中 的 微 码 对 图 18-2 的 微 编 码 FSM 进 行 仿真 的 波形 图 
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18.2 指令 序列 

通过 使 用 序列 发 生 器 来 产生 下 一 条 指令 的 地 址 使 得 构建 微 编码 FSM 相当 高 效 。 执 行 指令 
序列 有 两 大 优势 。 首 先 ， 对 于 只 是 进入 下 一 条 指令 的 简单 微 指 令 ， 其 指令 地 址 可 以 用 计数 器 生 
成 ， 避 免 在 微 码 存储 器 中 存放 这 些 地 址 。 其 次 ， 用 逻辑 电路 选择 或 组 合 不 同 的 输入 信号 ， 微 码 
存储 器 可 以 为 每 个 状态 保存 一 个 单独 的 微 指令 ， 而 不 是 必须 为 输入 信和 号 的 每 种 可 能 的 组 合 保存 
单独 的 (几乎 完全 相同 的 ) 指令 。 

K 18-2 中 微 码 的 概述 显示 了 序列 发 生 器 可 以 消除 的 元 余 。 当 所 有 指令 选择 它们 自己 或 按 
顺序 选择 下 一 条 指令 作为 下 一 个 状态 时 ， 每 条 指令 包含 一 个 明确 的 下 一 个 状态 字段 。 同 时 ， 对 
于 两 种 输入 状态 ， 两 条 指令 仅 在 下 一 个 状态 字段 上 略 有 差别 ， 所 有 指令 都 是 重复 的 。 如 果 有 多 
个 输入 信号 ， 这 些 开销 将 更 高 。 

为 微 编 码 FSM 增加 序列 发 生 器 是 从 FSM (下 一 个 状态 由 逻辑 函数 决定 ) 到 存储 程序 计算 
机 的 第 一 步 ， 在 存储 程序 计算 机 中 下 一 条 指令 由 翻译 当前 指令 来 决定 。 通 过 使 用 序列 发 生 器 ， 
微 编 码 状 态 机 像 存 储 程序 计算 机 那样 按 顺 序 逐 条 执行 微 指令 ， 直 到 有 分 支 指令 将 程序 重新 定位 
到 一 个 新 的 地 址 执行 。 

图 18-6 给 出 了 一 个 使 用 指令 序列 发 生 器 的 微 编码 FSM。 在 这 里 状态 寄存 器 用 微 码 计数 器 
(pPC 或 uPC) 寄存 器 代替 。 在 任何 时 候 ， 此 寄存 器 通过 选择 当前 微 指令 来 表示 当前 状态 。 在 
这 个 设计 中 我 们 已 经 将 微 码 存储 器 中 的 微 指令 数量 从 2 ”条 减少 到 2 条 ， 也 就 是 说 ， 每 个 状态 
的 微 指令 条 数 从 2 条 减少 到 1 条 。 指 令 条 数 减少 的 代价 就 是 将 每 条 微 指令 的 宽度 从 s + o 位 增 
加 到 s +o+6 位 。 每 条 微 指令 包含 三 个 字段 ， 如 图 18-7 所 示 : 一 个 。 位 字段 指定 当前 输出 信 
号 ， 一 个 * 位 字段 指定 分 支 指令 分 支 到 的 地 址 〈 分 支 目标 ) ， 一 个 位 字段 定义 分 支 指令 。 





branch_instruction 


图 18-6 使 用 指令 序列 发 生 器 的 微 编码 FSM。 根 据 分 支 指令 和 输入 信号 组 合 ， 多 路 选择 器 
和 增 量 器 计算 下 一 条 微 指令 地 址 (下 一 个 状态 ) 


Rb =- 


图 18-7 图 18-6 中 使 用 指令 序列 发 生 器 的 微 编 码 FSM 的 微 指令 格式 


有 了 指令 序列 发 生 器 ， 分 支 逻 辑 可 以 根据 当前 微 指令 中 分 支 指令 对 输入 信息 进行 测试 。 测 
试 的 结果 ， 序 列 发 生 器 要 么 分 支 〈 通 过 选择 分 支 目标 字段 作为 下 一 个 uPC) 要 么 不 分 支 (通过 
选择 uPC + 1 作为 下 一 个 uPC)。 
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考虑 一 个 两 位 输入 字段 的 例子 。 定 义 一 个 三 位 分 支 指令 brinst， 如 下 所 示 : 


a 


branch = (brinst[0] & in[0] | brinst[1] & in[1]) brinst [2] ; 


分 支 指令 第 0 位 和 第 1 位 选择 是 否 测试 输入 信号 第 0 位 或 第 1 位 (或 任意 一 个 ) 。 分 支 指令 第 2 
位 控制 测试 的 极 性 。 如 果 brinst [2] 为 低 电 平 ， 则 选择 的 位 为 高 电 平时 进行 分 支 。 和 否则 选择 
的 位 为 低 电 平时 进行 分 支 。 用 这 种 方法 对 分 支 指令 进行 编码 ,那么 可 以 执行 的 分 支 指令 如 
表 18-3 所 示 。 


表 18-3 分 支 指令 编码 


Nor | A 
001 | B | ” 当 输入 为 0 时 分 支 。 如 果 输入 为 0， 则 分 支 到 br_ upc， 理 则 执行 uPC+1 
010 BI 输入 为 1 时 分 支 























011 BA 分 支 到 任意 分 支 。 如 果 输 入 有 效 则 进行 分 支 

100 BR 直接 分 支 ; 输入 为 任何 值 都 进行 分 支 ，br_ upe 作为 下 一 个 uPC 
101 BNO 当 输入 不 为 0 时 分 支 。 如 果 输 入 不 为 0， 则 分 支 ， 和 否则 继续 uPC +1 
110 BNI 输入 不 为 1 时 进行 分 支 

111 BNA 当 输入 0 和 1 都 无 效 时 进行 分 支 


分 支 指令 还 可 以 用 其 他 方法 进行 编码 。 常 见 的 位 编码 使 用 n -1 位 来 选择 2 个 输入 信 
号 中 的 一 个 进行 测试 ， 剩 下 的 一 位 用 于 选择 在 选 定 的 输入 信号 为 高 电 平 或 低 电 平时 是 否 进 行 分 
支 。 输 入 信号 中 的 一 位 一 直 保 持 高 电 平 ， 表 示人 允许 创建 NOP 和 BR 指令 。 对 于 这 种 编码 方法 ， 
分 支 信号 如 下 : 


branch = brinst[n-1] ^ infbrinst[n-2:0]] ; 


通过 这 种 蔡 代 方法 创建 分 支 指令 (为 三 位 信号 brinst)， 三 个 输入 信号 如 表 18-4 所 示 。 
为 了 提供 NOP 和 BR 指令 ， 将 第 四 个 输入 信号 用 常量 1 进行 赋值 。 在 这 里 每 条 分 支 指令 精确 测 
试 一 个 输入 信号 ， 而 在 表 18-3 的 编码 方法 中 指令 可 以 测试 0 个 、1 个 或 2 个 输入 信号 。 除 了 目 
前 这 两 种 编码 方法 之 外 还 可 能 有 许多 其 他 编码 方法 。 


表 18-4 替代 的 分 支 指令 编码 













输入 为 0 时 转移 
输入 为 1 时 转移 
输入 为 2 时 转移 
总 是 转移 (输入 3 为 常量 “1”) 
输入 不 为 0 时 转移 
输入 不 为 1 时 转移 
输入 不 为 1 时 转移 
从 不 转移 
















































图 18-8 给 出 了 使 用 指令 序列 发 生 器 的 微 编 码 FSM 的 Verilog 程序 。 此 Verilog 程序 严格 按照 
图 18-6 所 示 的 框图 进行 编写 。 第 一 条 assign 语句 计算 信号 branch， 如 果 序 列 发 生 器 在 下 
一 个 周期 要 进行 分 支 则 此 信号 为 真 。 第 二 条 assign 语句 根据 branch 和 rst 信号 计算 下 一 
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个 微 码 计数 器 (nupc) 。 为 了 增强 程序 的 可 读 性 ,用 assign 语句 将 微 指令 的 三 个 字段 划分 
为 输出 信号 (nxt_out ) 、 分 支 目 标 (br_upc) 和 分 支 指令 (brinst) 三 部 分 。 使 用 这 些 
容易 记 住 的 名 字 而 不 用 uinst 的 索引 字段 ， 使 得 后 边 的 程序 更 容易 理解 。 


module ucode2(clk,rst,in,out) ; 
parameter n = 2 ; // 输入 信号 宽度 
parameter m i // 输出 信号 宽度 


= 9 
parameter k = 4 ; // 状态 位 数 
= 3 ; // 指令 位 数 








parameter j 


input clk, rst ; 
input [n-1:0] in ; 





output [m-1:0] out ; 





wire [k-1:0] nupe, upc ; // 微 程 序 计数 器 
wire [j+k+m-1:0] uinst ; // 微 指令 字 





// 分 离 微 指令 的 字段 

wire [m-1:0] nxt out ; // = uinst[m-1:0] ; 
wire [k-1:0] br_upe ; // = uinst[m+k-1:m] ; 
wire [j-1:0] brinst ; // = 

assign {brinst, br_upc, nxt_out} = uinst ; 


uinst [m+j+k-1:m+k] ; 


DFF #(k) upc_reg(clk, nupc, upc) ; // 微 程序 计数 器 
DFF #(m) out_reg(clk, nxt_out, out) ; // 输出 寄存 器 
ROM #(k,m+k+j) uc(upc, uinst) ; // 微 码 存储 





// 分 支 指令 编码 

wire branch = (brinst[0] & in[0] | brinst[1] & in[1]) ^ brinst[2] ; 

// PARES 

assign nupe = rst ? {k{1'b0}} : branch ? br_upe : upc + 1’bl ; 
endmodule 





图 18-8 指令 序列 发 生 器 微 编 码 FSM 的 Verilog 描述 


考虑 交通 灯 控 制 器 的 一 个 稍微 复杂 一 点 的 版 本 ， 除 了 南北 方向 和 东西 方向 信号 之 外 ， 还 包 
含 一 个 左 转 信 号 。 表 18-5 显示 了 其 微 码 。 在 这 里 输入 信号 0 表示 car_ltt， 输 入 信和 号 1 表示 car_ 
ew， 因 此 我 们 重新 命名 我 们 的 分 支 信号 BLT ( 如果 car_lt 有 效 则 分 支 ) A BNEW (如 果 car_ew 
无 效 则 分 支 ) ， 等 等 。 

K 18-5 所 示 的 微 码 从 状态 NS1 启动 ， 即 南北 方向 信号 灯亮 绿灯 。 在 此 状态 下 检测 左 转 传 
感 器 转移 到 LTI 的 信号 BLT。 如 果 car_lt 为 真 ， 则 控制 状态 转移 到 LT, AM uPC 进入 下 一 个 
状态 NS2。 在 NS2 状态 ， 如 果 car_ew 信号 为 假 (BNEW NS1) ， 则 微 码 转 回 NSI 状态 。 否 则 ， 
控制 转移 到 状态 EW1， 此 时 南北 方向 信号 灯 变 为 黄 灯 。EW1 经 常 紧 随 着 进入 EW2 状态 ， 即 东 
西方 向 信号 灯亮 绿灯 。BEW EW2 使 得 只 要 car_ew 为 真 ， 则 uPC 就 保持 EW2 状态 。 当 car_ew 
变 为 假 时 ，uPC 进入 状态 EW3 ， 此 时 东西 方向 信号 灯 变 为 黄 灯 ， 并 且 BR NS1 控制 状态 转 回 
NS1。 左 转 序列 (LT1, LT2, LT3) 以 类 似 方式 进行 操作 。 
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# 18-5 图 18-6 中 使 用 序列 发 生 器 的 交通 灯 控 制 器 的 微 码 





































































































地 址 brinst 目标 NS LT EW 数据 

0000 NS1 BLT (001) LT! (0101) 100001001 0010101100001001 
0001 I NS2 BNEW (110) NSI (0000) 100001001 1100000100001001 
0010 NOP (000) 010001001 00000000 10001001 
0011 BEW (010) EW2 (0011) 001001100 0100011001001 100 
0100 EW3 BR (100) NS1 (0000) 001001010 100000000 1001010 
0101 LTI NOP (000) 010001001 0000000010001001 
0110 LT2 BLT (001) LT2 (0110) 001100001 0010110001 100001 
0111 “BR (100) NS1 (0000) 001010001 1000000001010001 





图 18-8 的 微 编码 序列 发 生 器 运行 表 18-5 的 微 码 进行 仿真 的 波形 图 如 图 18-9 所 示 。 从 图 形 
顶部 数 第 五 行 显示 了 微 程 序 计数 器 upc。 状 态 机 复位 到 upc =0 (NS1) ， 前 进 到 1 (NS2), #& 
后 在 分 支 到 5 (LTI) 之 前 返回 到 0 (NS1 ) 。 状 态 机 从 5 (LT1) 前 进 到 6 (LT2) 并 保持 6， 直 
到 car_lt 变 为 低 电 平 为 止 。 然 后 状态 前 进 到 7 (LT3) 再 返回 到 0 (NS1) 。 此 时 car_ew =1， 接 
下 来 的 状态 序列 为 0，1，2,， 3 (NS1，NS2，EW1，EW2 ) 。 状 态 机 停留 在 3 (EW2) 直到 car_ 
ew 变 为 低 电 平 ， 然 后 前 进 到 4 (EW3) 再 返回 到 0 (NS1)。 状 态 机 在 状态 NS1 和 状态 NS2 之 
间 进 行 几 次 循环 ， 一 直到 信号 car_ew 和 car_lt 同时 变 为 高 电 平 为 止 。 当 这 些 发 生 时 状态 机 处 于 
状态 NS1， 因 此 首先 检测 到 信和 号 car_ lt，uPC 指向 LT1。 

由 于 图 18-6 的 微 编码 FSM 在 每 条 微 指令 时 只 能 进行 一 路 分 支 ， 因 此 用 两 个 状态 
(NS1 和 NS2) 实现 保持 南北 方向 、 变 为 东西 方向 或 变 为 左 转 之 间 的 三 路 分 支 。 这 样 做 导 
致 有 两 个 状态 (NS1 和 NS2 ) 南北 方向 信号 灯亮 绿灯 ， 有 两 个 状态 (EW1 #l EW2) 南北 
方向 信号 灯亮 黄 灯 。 真 正解 决 这 个 问题 的 方法 是 支持 多 路 分 支 (我 们 将 在 下 面 讨 论 ) 。 然 
而 ， 我 们 可 以 通过 使 用 表 18-6 的 替代 微 码 ， 用 软件 的 方法 部 分 解决 这 个 问题 。 

在 表 18-6 给 出 的 替代 微 码 中 ， 通 过 使 用 BNA NSI (在 NS] 没有 任何 输入 时 分 支 ) ， 使 
得 只 要 car_ew 和 car_lt 信和 号 都 为 假 则 uPC 保持 状态 NS1。 现 在 NS 成 为 南北 方向 信号 灯亮 绿 
灯 的 唯一 状态 。 如 果 任 何 输入 信和 号 为 真 ，uPC 前 进 到 状态 NS2 ， 此 状态 是 南北 方向 信号 灯亮 
黄 灯 的 唯一 状态 。 状 态 NS2 测试 输入 信号 car_lt， 如 果 ear_lt 为 真 则 分 支 到 状态 LTI (BLT 
LT1), WR kaqa 为 假 ，uPC 前 进 到 EW1。 除 了 状态 EW 和 LT 进行 了 重新 编号 ， 状 态 机 其 
余部 分 类 似 于 表 18-5, 

此 替代 微 码 的 仿真 波形 如 图 18-10 所 示 。 


表 18-6 图 18-6 中 使 用 序列 发 生 器 的 交通 灯 控制 器 的 替代 微 码 


NS LT EW 



















1110000100001001 


0010100010001001 






0100010001001 100 










1000000001001010 











0010100001 100001 
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/testlS/uc/clk 
/testlS/uc/rst 
/testlS/uc/in 00 
/testlS/uc/out 
/testlS/uc/upe 
/testlS/uc/uinst 
/testlS/uc/br_upc 


/testlS/uc/brinst 
/testiS/uc/branch 


图 18-9 ”使 用 表 18-5 的 微 码 对 图 18-8 中 的 微 编码 FSM 进 行 仿真 的 波形 图 


/testiS/uc/clk 


/testlS/uc/rst 


/testlS/uc/in 00 
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/testlS/uc/upe 


/testlS/uc/uinst 


/testlS/uc/br_upc 


/testlS/uc/brinst 





/testlS/uc/branch 


图 18-10 ”使 用 表 18-6 的 微 码 对 图 18-8 中 的 微 编码 FSM 进 行 仿真 的 波形 图 
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18.3 多 路 分 支 


正如 我 们 在 18.2 节 所 看 到 的 那样 ， 使 用 指令 序列 发 生 器 很 大 程度 上 减少 了 微 码 存储 器 的 
大 小 ,但 是 代价 就 是 限制 每 个 状态 最 多 有 两 个 下 一 个 状态 (upc +1 和 br_upc)。 如 果 我 们 的 
FSM 从 一 个 特定 状态 出 发 有 大 量 出 口 ， 则 这 样 的 限制 就 成 为 问题 。 例 如 ， 在 微 编码 处 理 器 中 ， 
基于 当前 指令 的 操作 码 可 能 分 支 到 数 十 个 甚至 数 百 个 下 一 个 状态 ， 这 是 非常 典型 的 。 另 外 , 在 
指令 的 寻 址 模式 下 也 需要 多 路 分 支 。 如 果 用 18. 2 节 中 的 序列 发 生 器 来 实现 这 样 的 多 路 调度 ， 
由 于 测试 n 个 不 同 的 操作 码 需 要 nn 个 周期 ,实现 起 来 效率 会 非常 低下 。 

如 图 18-11 所 示 ， 我 们 可 以 通过 使 用 支持 多 路 分 支 的 指令 序列 发 生 器 来 克服 两 路 分 支 的 限 
制 。 此 序列 发 生 器 与 图 18-6 中 的 序列 发 生 器 类 似 ， 除 了 分 支 目标 br_upe 由 分 支 指 令 brinst 和 输 
人 信和 号 产生 ， 而 不 是 直接 由 微 指令 提供 。 通 过 这 种 方法 ， 从 每 一 个 状态 可 以 分 支 到 2 个 下 一 
个 状态 〈 每 种 输入 组 合生 成 一 个 状态 ) 。 


branch_instruction 
图 18-11 使 用 支持 多 路 分 支 的 指令 序列 发 生 器 的 微 编码 FSM 


分 支 指令 编码 不 仅仅 是 测试 条 件 ， 还 是 如 何 决定 分 支 目标 的 条 件 。 表 18-7 给 出 了 一 种 可 
行 的 对 多 路 分 支 指 令 进 行 编码 的 方法 。BRx 和 BRN: 指令 是 两 路 分 支 指令 ， 同 表 18-4 中 定义 的 
分 支 指令 完全 相同 。BR4 指令 是 四 路 分 支 指令 ， 根 据 输入 信号 选择 4 个 相 邻 状态 CM br_upe 
到 br_upc +3) 中 的 一 个 。 





表 18-7 支持 多 路 分 支 的 微 编 码 FSM 的 分 支 指令 











说 明 
条 件 x 满足 时 分 支 ( 见 表 18-4， 包 括 BR) 

条 件 x 不 满足 时 分 支 ( 见 表 18-4, 包括 NOP) 
四 路 分 支 : nupc =br_upc + in 











使 用 BR4 指令 在 将 状态 映射 到 微 指令 地 址 时 需 
要 谨慎 小 心 ， 可 能 需要 复 用 一 些 状态 。 例 如 ， 考 虑 图 
18-12 的 状态 图 。 将 该 状态 图 映射 到 状态 机 的 微 码 地 
址 ， 用 四 路 分 支 指令 增加 输入 信号 到 分 支 目 标 ， 如 表 
18-8 所 示 。 从 X 出 来 的 四 路 分 支 目 标 地 址 为 000， 因 
此 我 们 必须 将 分 支 目标 Al Bl. Cl 和 X 相应 地 布置 
在 位 置 000、001、010 和 011。 以 类 似 的 方式 我 们 将 
状态 进行 定位 ， 使 得 从 Cl 出 发 的 四 路 分 支 目标 地 址 
为 100。 因 此 我 们 必须 将 状态 C2、C3 、X 和 Cl 相应 
地 放置 在 100、101、110 和 111。 要 完成 这 项 工作 我 18-12 具有 两 个 四 路 分 支 的 状态 图 
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们 需要 两 个 X 状态 ， 一 个 位 于 011 一 个 位 于 110， 需 要 两 个 C1 状态 (位 于 010 和 111)。 当 我 
们 用 这 种 方式 复 用 一 个 状态 时 ， 只 需要 为 两 个 副本 (如 X 和 X’) 安排 相同 的 行为 。 
表 18-8 图 18-12 到 微 码 地 址 的 状态 映射 图 。 状 态 X 和 状态 C1 是 重复 的 ， 它 们 在 两 个 四 路 

分 支 中 都 出 现 了 




















18.4 多 种 指令 类 型 

到 目前 为 止 ， 我 们 已 经 研究 过 在 每 一 条 微 指令 中 更 新 所 有 输出 信号 位 的 微 编码 FSM。 通 
常 ， 大 多 数 PSM 在 给 定 的 状态 下 只 需要 更 新 所 有 输出 信号 的 一 个 子 集 。 例 如 ， 我 们 的 交通 灯 
控制 器 FSM 在 每 次 状态 改变 时 最 多 改变 一 个 信号 灯 。 可 以 通过 修改 FSM 使 得 在 任何 给 定 的 状 
态 下 只 更 新 一 个 输出 寄存 器 来 保存 微 指令 的 数据 位 。 我 们 利用 其 他 微 指令 位 在 每 条 微 指令 中 指 
定 一 个 分 支 指令 和 分 支 目标 ， 尽 管 许多 微 指令 常常 前 进 到 下 一 个 状态 而 不 发 生 分 支 。 我们 可 以 
通过 只 在 一 些 指令 中 进行 分 支 而 在 其 他 指令 中 更 新 输出 信号 来 节省 这 些 宛 余 的 分 支 位 。 

图 18-13 给 出 了 两 种 微 指令 类 型 的 微 编码 FSM 
的 指令 格式 : 分 支 指令 和 存储 (输出 ) 指令 。 每、 分 支 指令 
条 微 指令 不 是 这 种 类 型 就 是 那 种 类 型 。 最 左边 一 位 ay eae i 
为 1 识别 为 分 支 指令 ， 指 定 了 分 支 条 件 和 分 支 目 
标 。 当 FSM 遇 到 分 支 微 指令 时 ， 按 照 分 支 条 件 和 存储 指令 [o] am | | 


y 


分 支 目 标 指定 的 方式 进行 分 支 (或 不 分 支 ) 。 输 出 
信号 不 需要 更 新 。 最 左边 一 位 为 0 识别 为 存储 指 
令 ， 指 定 输出 寄存 器 和 输出 值 。 当 FSM 遇 到 存储 ”图 18-13 具有 独立 输出 和 分 支 指令 的 微 纺 
微 指 令 时 ， 将 值 存储 到 指定 的 输出 寄存 器 ， 然 后 依 码 FSM 的 指令 格式 

次 执行 下 一 条 微 指令 。 存 储 指令 不 进行 分 支 。 

图 18-14 给 出 了 支持 图 18-13 中 的 两 种 指令 的 微 编码 PSM 的 框图 。 每 条 微 指 令 划 分 为 x 位 
的 指令 字段 和 位 的 值 字段 。 指 令 字段 保存 操作 码 (opcode) 位 (最 左边 一 位 区 分 分 支 指令 和 
存储 指令 ) 和 条 件 (分 支 指 令 ) 或 者 目的 (存储 指令 )。 值 字段 保存 分 支 目 标 (分 支 指令 ) 或 
新 的 输出 值 (存储 指令 )。 

图 18-14 中 的 指令 序列 发 生 器 同 图 18-6 中 完全 相同 ， 除 了 当前 微 指 令 是 存储 指令 时 ， 分 支 
逻辑 通常 选择 下 一 条 微 指 令 uPC + 1。2 主要 不 同 在 于 输出 逻辑 。 在 这 里 译 码 器 使 得 在 存储 指令 
中 最 多 有 一 个 输出 寄存 器 接收 值 字 段 。 

图 18-14 中 有 两 种 指令 类 型 的 微 码 引擎 的 Verilog 程序 如 图 18-15 所 示 。 在 这 里 微 指 令 分 解 为 
操作 码 (0 = 存储 指令 ，1 = 分 支 指令 )、 指 令 (存储 指令 的 目的 地 ,分支 指令 的 条 件 ) 和 值 。 对 
于 存储 指令 ， 目 标 译 码 为 支持 独 热 码 的 向 量 e， 用 于 将 值 存储 到 三 个 输出 寄存 器 中 的 一 个 (NS = 
0, EW=1, LT=2) 或 者 用 于 载 人 定时 器 (destination =3 ) 。 对 于 分 支 指令 ，inst[2] 决 定 了 分 
支 的 优先 级 ， 低 两 位 inst[1 :0] 决 定 测试 的 条 件 (LT=0，EW =1，LTI EW =2, timer=3), 


O “可 以 很 容易 为 支持 多 路 分 支 的 ESM (图 18-11) 添加 多 个 指令 类 型 和 输出 寄存 器 。 











图 18-14 有 输出 指令 的 微 编码 FSM 的 框图 。 对 于 我 们 的 交通 灯 控 制 器 ， 用 定时 器 代替 最 后 输出 
寄存 器 ， 并 将 其 done 信和 号 反馈 到 分 支 逮 辑 





module ucodeMI(clk,rst,in,out) ; 


parameter n = 2 ; // 输入 信号 宽度 


parameter 
parameter 


= 9 ; // 输出 信号 宽度 
i // 输出 子 信 号 宽度 


m 
° 

parameter k = 5 ; // 状态 位 数 
j 


parameter 


input clk, 
input [n-1:0] in ; 
output [m-1:0] out ; 


i // 指令 位 数 


wire [k-1:0] nupc, upc ; // 微 程序 计数 器 


wire [j+k-1:0] uinst ; 


// 微 指令 字 


wire done ; // 定时 器 done 信 号 


// 分 离 微 指令 字段 
wire opcode ; // 操作 码 位 


wire [j-2:0] inst ; // 分 支 条 件 ， 存 储 目标 
wire [k-1:0] value ; // 分 支 目标 ， 存 储 值 


assign {opcode, inst, value} = uinst ; 


DFF #(k) upc_reg(clk, nupc, upc) ; // 微 程序 计数 器 
ROM #(k,k+j) uc(upe, uinst) ; // 微 码 存储 


// 输出 寄存 器 和 定时 器 

DFFE #(0) or0(clk, e[0], 
DFFE #(0) orl(clk, e[1], 
DFFE #(0) or2(clk, e[2], 
Timer #(k) tim(clk, rst, 


// 使 能 输出 寄存 器 和 定时 器 


value[o-1:0], out[o-1:0]) ; // NS 
value[o-1:0], ocut[2*o-1:o]) ; // EW 
value[o-1:0], out[3*o-1:2*o]) ; // LT 
e[3], value, done) ; // 定时 器 


wire [3:0] e = opcode ? 4'b0 : l<<inst ; 


// 分 支 指令 译 码 





图 18-15 有 两 种 指令 类 型 的 微 编码 FSM 的 Verilog 描述 
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wire branch = opcode ? (inst [2] (((inst[1:0] == 0) & in[0]) | // BLT 


( (inst [1:0] == 1) & in[1]) | // BEW 
((inst [1:0] == 2) & (in[0]|in[1])) | //BLE 
((inst[1:0] == 3) & done))) // BTD 
: 1'bO ; // 作为 存储 操作 码 
// 微 程序 计数 器 
assign nupc = rst ? {k{1’b0}} : branch ? value : upc + 1'b1 ; 
endmodule 








图 18-15 (4) 


K 18-9 给 出 了 更 加 复杂 的 交通 灯 控 制 器 的 微 码 ， 这 是 根据 图 18-15 的 微 码 引擎 编写 的 。 前 
边 三 个 状态 载 人 三 个 输出 寄存 器 ， 东 西方 向 寄存 器 和 左 转 寄 存 器 为 RED， 南 北方 向 寄存 器 为 
GREEN。 下 一 个 状态 NS1 和 NS2 等 待 8 个 周期 来 载 人 定时 器 并 等 待 信号 done 有 效 。 然 后 状态 
NS4 等 待 输入 信号 。NS5 状态 时 南北 方向 信号 灯 设置 为 YELLOW; NS6 和 NS7 状态 设置 定时 器 
并 等 到 定时 器 完成 定时 ， 然 后 进入 NS8 状态 ， 此 时 南北 方向 信号 灯 设 置 为 RED。 如 果 左 转 输 
入 信号 为 真 ，NS9 状态 分 支 到 LT 状态 按照 左 转 信 号 灯 序 列 转换 。 和 否则 东西 方向 信号 灯 在 状态 
EW1 ~ EW9 按 序 转换 。 对 该 微 码 进行 仿真 产生 的 波形 如 图 18-16 所 示 。 


表 18-9 用 两 种 指令 类 型 的 FSM 实现 交通 灯 控 制 器 的 微 码 








地 址 状态 指令 值 数据 

00000 RSTI SLT (0010) RED 001 001000001 
00001 RST2 SEW (0001) RED 001 000100001 
00010 NS1 SNS (0000) GREEN 100 000000100 
00011 NS2 STIM (0011) TGRN 01000 001101000 
00100 NS3 BNTD (1111) NS3 00100 111100100 
00101 NS4 BNLE (1110) NS4 00101 111000101 
00110 NSS SNS (0000) YELLOW 010 000000010. 
00111 NS6 STIM (0011) TYEL 00011 001100011 
01000 NS7 BNTD (1111) NS7 01000 111101000 
01001 NS8 SNS (0000) RED 001 000000001 
01010 NS9 BLT (1000) LT1 10100 100010100 
01011 EWI STIM (0011) TRED 00010 001100010 
01100 EW2 BNTD (1111) EW2 01100 111101100 
01101 EW3 SEW (0001) GREEN 100 000100100 
01110 EW4 STIM (0011) TGRN 01000 001101000 
01111 EWS BNTD (1111) EWS 01111 111101111 
10000 EW6 SEW (0001) YELLOW 010 000100010 
10001 EW7 STIM (0011) TYEL 00011 001100011 
10010 EW8 BNTD (1111) EW8 10010 111110010 
10011 EW9 BTD (1011) RST2 00001 101100001 
10100 LTI STIM (0011) TRED 00010 001100010 
10101 LT2 BNTD (1111) LT2 10101 111110101 
10110 LT3 SLT (0010) GREEN 100 001000100 
10111 LT4 STIM (0011) TGRN 01000 001101000 
11000 LTS BNTD (1111) LTS 11000 111111000 
11001 LT6 SLT (0010) YELLOW 010 001000010 
11010 LT7 STIM (0011) TYEL 00011 001100011 
11011 LT8 BNTD (1111) LT8 10010 111111011 
11100 LT9 BTD (1011) RST1 00000 101100000 
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图 18-16 ”用 表 18-9 的 微 码 对 图 18-15 的 微 编码 FSM 进 行 仿真 生成 的 波形 


c/rst 
/uc/in 00 
c/out 
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18.5 微 码 子 程序 


K 18-9 的 状态 序列 重复 的 地 方 很 多 。NS、EW 和 LT 序列 执行 几乎 相同 的 动作 。 唯 一 明显 
的 区 别 就 是 写 入 的 输出 寄存 器 不 同 。 就 像 我 们 在 第 17 章 中 通过 因 式 分 解 FSM 来 共享 相同 的 状 
态 序 列 一 样 ， 我 们 可 以 通过 在 微 编码 FSM 中 支持 子 程序 来 实现 共享 相同 的 状态 序列 。 子 程序 
是 一 个 指令 序列 ， 它 能 够 在 一 些 不 同 的 点 被 调用 ， 退 出 子 程序 之 后 将 控制 返回 到 调用 它 的 点 。 

图 18-17 给 出 了 支持 一 级 子 程序 的 微 码 引 警 的 框图 。 该 状态 机 与 图 18-14 的 状态 机 几乎 完 
全 相同 ， 除 了 两 个 不 同 点 : (a) 序列 发 生 器 中 增加 了 返回 uPC 寄存 器 rupe 以 及 相关 的 逻辑 ， 
(b) 输出 部 分 增加 了 选择 寄存 器 和 相关 的 逻辑 。 

rupe 寄存 器 用 于 保存 子 程序 执行 完 之 后 应 该 分 支 到 的 upc。 当 子 程序 被 调用 时 ， 分支 目标 
被 选 作 下 一 个 upc， 并 且 下 一 条 指令 的 地 址 upe + 1 依次 保存 在 mupe 寄存 器 中 。 使 用 专门 的 分 支 
指令 CALL 使 得 使 能 信号 线 指 向 rupe 寄存 器 ，erpec 有 效 。 当 子 程序 完成 之 后 ， 将 控制 返回 到 保 
存 的 位 置 ， 用 另 一 个 专门 的 分 支 指令 RET 选择 rupe 作为 下 一 个 upe 的 来 源 。 

选择 寄存 器 用 于 在 不 同 的 地 方 被 调用 时 允许 将 相同 的 状态 序列 写 人 不 同 的 输出 寄存 器 中 。 
两 位 寄存 器 识别 码 (NS =0，EW =1，LT=2) 可 以 存储 在 选择 寄存 器 中 。 然 后 用 专门 的 存储 
指令 SSEL 对 选择 寄存 器 指定 的 寄存 器 〈 而 不 是 由 指令 的 目标 位 指定 ) 进行 存储 。 因 此 ， 主 程 
序 可 以 存储 0 (NS) 到 选择 寄存 器 中 ， 然 后 调用 子 程序 来 排序 南北 方向 信号 灯 的 亮 灭 。 然 后 主 
程序 可 以 存储 1 (EW) 到 选择 寄存 器 中 ， 并 调用 相同 的 子 程序 来 排序 东西 方向 信号 灯 的 亮 灭 。 
同一 个 子 程序 可 以 排序 不 同方 向 的 信号 灯 是 由 于 它 用 SSEL 指令 完成 所 有 的 输出 操作 。 





图 18-17 支持 一 级 子 程 序 的 微 编码 FSM 


18.6 简单 计算 机 


在 这 一 章 里 ， 我 们 从 一 个 简单 的 微 编 码 FSM 开始 ， 构 建 出 一 个 包含 分 支 指令 和 多 个 输出 
寄存 器 的 系统 。 这 一 节 我 们 继续 完善 实现 一 个 简单 处 理 器 。 这 个 设计 目的 在 于 ， 通 过 说 明 一 个 
处 理 器 实际 上 是 多 么 简单 来 揭秘 处 理 器 ， 而 不 是 为 了 给 出 一 个 例子 说 明 处 理 器 应 该 是 什么 样 
的 。 这 个 设计 专注 于 最 简单 的 处 理 器 ， 而 在 性 能 、 效 率 和 易 编程 方面 不 过 多 考虑 。 

该 处 理 器 支持 三 种 主要 类 型 的 指令 : 分 支 指令 、 传 送 指令 和 算术 指令 。 不 管 哪 种 类 型 的 指 
令 ， 长 度 都 固定 为 一 个 字 节 大 小 。 高 4 位 i[7:4] 表示 指令 的 操作 码 。 低 4 位 的 解释 依赖 于 操 
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作 码 。 我 们 在 表 18-10 中 概括 出 了 16 种 不 同 的 指令 。 

分 支 目标 没有 存放 在 指令 ROM 中 ， 而 是 存储 在 分 支 目标 寄 存 器 BRD 中 。BR 指令 之 后 的 
下 一 个 PC 的 值 等 于 BRD 的 值 。 为 了 更 高 效 地 调用 子 程序 ，BR. S 指令 将 PC +1 存储 到 BRD 
中 。BR. IM 指令 根据 8 位 输入 信号 和 定时 器 的 done 信和 号， 使 用 存储 在 寄存 器 IM 中 的 十 位 分 支 
指令 进行 分 支 。 分 支 指令 按照 表 18-3 显示 的 那样 工作 ， 除 了 输入 信号 为 9 个 〈8 个 输入 信号 和 
定时 器) 而 不 是 2 个 。BR. IMI 指令 也 用 IM 寄存 器 ， 但 是 目标 是 PCc +i[3:0]。 最 后 ， 
BR. ACC 指令 根据 累加 器 寄存 器 (ACC) 进行 分 支 。 指 令 的 第 3 位 和 第 2 位 表示 分 支 条 件 。 

表 18-10 处理 器 用 到 的 操作 码 列表 。 以 1 开头 的 操作 码 是 ALU 中 的 运算 操作 码 ， 指 令 的 低 4 位 为 


ALU 和 LDA 指令 的 RS 进行 编码 。 对 于 特定 的 指令 ， 可 以 表示 分 支 条 件 (BR ACC), 
立即 数 (BR. IMI，LDA. I) 或 目标 (STA) 



























































操作 码 i[7:4] 指令 - # OR 
0000 BR 分 支 到 BRD 存储 的 PC 
0001 BR. S 分 支 到 BRD 存储 的 PC， 再 将 PC +1 存 到 BRD 
0010 BR. IM 根据 输入 信号 和 存储 在 IM 中 的 当前 分 支 指令 进行 分 支 ; 分 支 目标 是 BRD 
0011 | BR.IMI 除了 分 支 目标 是 PC +i[3:0] ， 其 他 同 BRIM 
ör ËB 266 如 果 ACC 满足 存储 在 位 [4:3] 的 条 件 (00 表示 等 于 0; 01 表示 不 等 于 0; 10 表 
示 大 于 0; 11 表示 小 于 0) ， 则 分 支 到 BR 寄存 器 保存 的 地 址 
0101 LDA ACC =RS(i[3:0]) 
0110 LDA. I ACC =i[3:0] 
0111 STA RD(i[ 3:0] ) = ACC 
1000 ADD ACC = ACC + RS(i[ 3:0] ) 
1001 SUB ACC = ACC. RS 
1010 MUL | ACC. H, ACC] = ACC * RS 
1011 SH | ACC. H,ACC} = |16'd0, ACC} < <RS 
1100 XOR ACC = ACC@RS 
1101 | AND ACC = ACC) ARS 
1110 OR ACC = ACC V RS 
1111 NOT ACC = ACG 





K 18-11 列 出 了 处 理 器 的 寄存 器 ， 许 多 寄存 器 只 有 唯一 的 功能 。 系 统 的 输出 为 4 个 16 位 寄 
fat: 00 ~ 03。 临 时 寄存 器 (TO~T2) 用 于 存储 中 间 值 。PC 保存 当前 程序 计数 器 ， 并 且 对 于 
所 有 非 分 支 指令 〈 用 作 RS) 来 说 都 是 只 读 的 。 还 支持 进行 写 人 操作 时 载 人 定时 器 。8 位 输入 
信号 位 作为 一 个 只 读 寄存 器 出 现 。 累 加 器 拆 分 为 16 位 的 高 位 寄存 器 和 低位 寄存 器 。 只 有 乘法 
和 移 位 指令 会 往 高 位 写 人 数据 。 


表 18-11 处 理 器 保留 的 状态 。 指 令 ROM (通过 PC 进行 访问 ) 和 数据 RAM 没有 给 出 ， 当 MD F 
存 器 用 作 源 操作 数 或 目的 操作 数 时 ， 通 过 地 址 寄存 器 MA 访问 数据 RAM 


























ID 寄存 器 长 度 (b) #f 述 
0000 ACC 16 所 有 算术 操作 的 隐 式 目标 
0001 ACC. H 16 | 累加 器 高 16 位 

0010 00 16 | 寄存 器 连接 到 输出 端 

0011 | ol 16 寄存 器 连接 到 输出 端 

0100 02 16 | 寄存 器 连接 到 输出 端 
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ID 寄存 器 描 Ë 
0101 03 寄存 器 连接 到 输出 端 

0110 BRD 分 支 目标 寄存 器 

0111 MA 存储 器 地 址 

1000 MD 存储 器 源 寄存 器 

1001 IM 分 支 指令 寄存 器 

1010 T0 临时 寄存 器 0 

1011 TI 16 临时 寄存 器 1 

1100 T2 16 临时 寄存 器 2 

1101 IN 输入 值 ， 只 读 

1110 PC 当前 程序 计数 器 ， 只 读 

1111 timer 定时 器 ， 只 写 ; 当 用 作 目 的 时 载 人 一 个 新 的 启动 时 间 


处 理 器 包含 一 个 算术 逻辑 单元 (ALU) 。 给 定 操作 码 和 两 个 输入 信号 ，ALU 执行 指定 的 操作 
并 输出 运算 结果 。 在 结构 上 ，ALU 计算 8 种 不 同 的 操作 ， 然 后 用 一 个 8 位 多 路 选择 器 对 运算 结果 
进行 选择 输出 。 类 似 于 16. 2. 3 节 中 的 通用 移 位 器 /计数 器 ， 只 是 没有 内 部 状态 。ALU 的 Verilog 程 
序 如 图 18-18 所 示 。 输 出 函数 通过 case 语句 选 定 ， 我 们 只 需要 实例 化 一 个 加 法 器 /减法 器 。 








input [2:0] opcode; 
input signed [15:0] s0, sl; 
output [15:0] o_low, o_high; 


output write high; 
reg [15:0] o_low, o_high; 
reg write_high; 
wire sub = 


wire [15:0] addsub_val 
wire signed [31:0] product 
//o_high = s0>>(16-s1) 


//o_low = s0<<s1 

wire [31:0] 

always@(*) begin 
case (opcode) 


‘OP_ADD: {o_ high, o_low, write high} = {16'd0, addsub val, 1’b0}; 
‘OP_SUB: {o_high, o_low, write high} = {16'd0, addsub val, 1'b0}; 
‘OP MUL: {o_high, o_low, write high} = (product, 1’b1}; 

‘OP_SH: {o_high, o_low, write_high} = {shft, 1’b1}; 

‘OP_XOR: {o_high, o_low, write high) = {16'd0, s0^s1, 1’b0}; 
‘OP_AND: {o_high, o_low, write high) = {16'd0, s0&si, 1'b0}; 


‘OP_OR: {o_high, o_low, write_high} = {16’d0, s0|si, 1’b0}; 
‘OP_NOT: {o_high, o low, write high} = {16’d0, ~s0, 1'b0}; 
default: {o_high, o_low, write high} = {32’d0, 1’b0}; 


endcase // case (opcode) 


end 


endmodule // alu 


{16’ho000, s0} << sl; 





module alu(opcode, s0, sl, o_high, o_low, write high) ; 


‘OP_SUB) ; 
s0 + (sub ? “sl : sl) + sub; 
s0*sl1; 








图 18-18 简单 ALU 的 Verilog 程序 。 只 有 移 位 操作 和 乘法 操作 才 对 累加 器 的 高 数据 位 进行 写 和 操作 
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通过 MD 和 MA 寄存 器 存 取 数据 RAM (L 8.945), `4 MD 用 作 任 何 LD 或 ALU 指令 的 源 
寄存 器 时 ， 将 存储 器 RAM 中 地 址 为 MA 的 存储 单元 所 存储 的 值 载 人 寄存 器 MD。 当 MD 是 STA 
指令 的 目的 寄存 器 时 ，ACC 中 的 值 放 人 存储 器 地 址 MA 中 。 

处 理 器 模块 的 Verilog 程序 如 图 18-19 ~ 图 18-21 所 示 。 程序 的 第 一 部 分 (图 18-19) 从 指令 
ROM 中 载 人 当前 指令 并 对 当前 指令 进行 分 析 。 用 case 语句 从 16 个 选项 中 选择 正确 的 源 寄存 器 。 
在 程序 的 第 二 部 分 和 第 三 部 分 (图 18-20 和 图 18-21 ) ， 程 序 计 算 分 支 条 件 和 下 一 个 程序 计数 器 。 
使 能 信号 en 用 于 写 人 正确 的 寄存 器 。Verilog 程序 以 所 有 状态 寄存 器 结束 ， 包 括 定时 器 和 PC。 

我 们 的 简单 处 理 器 执行 存储 在 ROM 中 的 软件 程序 。 例 如 ， 图 18-22 所 示 的 计算 斐 波 那 契 
数列 的 程序 。 执 行 该 程序 的 波形 结果 如 图 18-23 所 示 。 程 序 通过 往 寄存 器 中 载 人 一 些 常量 来 初 
始 化 状态 ， 同 时 也 读 取 输 入 信号 决定 需要 计算 多 少数 字 。 从 PC =9 开始 的 循环 计算 下 一 个 数 
字 并 将 它 传输 到 oo 。 循 环 次 数 01 是 递减 的 ， 如 果 循 环 次 数 不 为 0 则 分 支 到 循环 开始 的 地 方 继 
续 执 行 。 





š 
module processor(o0, ol, 02, 03, in, rst, clk) ; 


parameter programFile = "fib.asm"; 


input [7:0] in; 
input Est, lk; 
output [15:0] 00, öl, 02, 03; 





// 取 指令 ， 分 析 指 令 

wire [7:0] ai; // 指令 

wire [15:0] pc; 

ROM #(8, 16, programFile) insnStore(pc, i); 
wire [3:0] op = i[7:4]; // 操 作 码 

wire alu op = op[3] ; // 算 术 操 作 
wire [2:0] alu opcode = op[2:0]; 

wire [1:0] br op = i[3:2]; // 分 支 指令 操作 码 
wire [3:0] rs = i[3:0]; // 源 寄存 器 


// 寄 存 器 状态 

wire [15:0] acc, acch, brd, ma, mout, t0, tl, t2; 
wire tdone; 

wire [9:0] im; 

// 源 寄存 器 译 码 

reg [15:0] BL; 


always@(*) begin 
case (rs) 
‘RACC: sl = acc; 
‘RACCH: sl = acch; 





‘ROO: sl = 00; 
ROL: 81 = Ol; 
RO2: sl = 02; 
RO3: sl = 03; 


‘RBRD: sl = brd; 








图 18-19 处理 器 的 Verilog 程序 ， 三 部 分 中 的 第 一 部 分 。 模 块 的 这 部 分 用 地 址 PC 读 取 指令 
ROM 并 分 析 指 令 i。 通 过 case 语句 找到 正确 的 源 寄存 器 
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: sl ma; 

3 81 mout ; 
‘RIM: sl {6‘do, im}; 
“RTO: 81 t0; 
RIL: 81 CIs 
“RT2: s1 t2; 
‘RIN: sl = {8’d0, in}; 
“RPC: sl pc; 
default: 16'd0; 


endcase // case (rs) 








end 
图 18-19 (2) 
// 计 算 下 一 个 PC 
// im 寄存 器 分 支 条 件 
wire imbranch = im[9] ^ (| ({im[8]&tdone, im[7:0] & in})); 
//acc 分 支 条 件 
wire acc eqz = (acc == 16’d0); 
wire accbranch = 
{br op == ‘BR_EQ & acc eqz) | 
(br op == ‘BR_NEQ & (!acc_eqz)) | 
(br_op == 'BR_GZ & (!acc_eqz) & !acc[15]) | 
(br op == ‘BR LZ & (!acc_eqz) & acc[15]); 
// BAR 
wire bran = (op == ‘OP_BR) | (op == ‘OP_BRS) | 
((op == ‘OP_BRIM | op == ‘OP_BRIMI) & imbranch) | 


((op==*OP_BRACC) & accbranch) ; 


// 计算 下 一 个 PC 
wire [15:0] npc = bran ? (op == ‘OP_BRIMI ? pc + i[3:0] : brd) : pe + 1; 
wire [15:0] nper = rst ? 16'd0 : npc; 


// ALU 和 下 一 个 累加 器 的 输入 

wire write high; 

wire [15:0] o high, o_low; ' 

alu theALU(alu_opcode, acc, sl, o_high, o low, write_high) ; 


wire [15:0] acc nxt = (({16{alu_op}} & o low) | 


({16{op == ‘OP_LDA}} & s1) | 

({16{op == ‘OP_LDAI}} & rs)) & {16{~rst}}; 
wire [15:0] acch_nxt = (({16{alu_op}} & o_high) | 

({16{op == ‘OP_STA}} & acc)) & 


{16{~rst}}; 
// 下 一 个 brd 寄 存 器 值 
wire [15:0] brdn = (op == ‘OP_BRS) ? pc+1 : acc; 
wire [15:0] brdr = rst ? 16’d0O : brdn; 








图 18-20 处理 器 的 Verilog 程序 ， 三 部 分 中 的 第 二 部 分 。 此 程序 顶端 计算 分 支 条 件 和 目 
标 。 它 还 为 累加 器 寄存 器 分 配 下 一 个 值 ， 为 我 们 已 构造 的 状态 分 配 使 能 信号 en 
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// 计算 寄存 器 的 写 入 信号 


wire [15:0] en i = l<<rs; 


wire [15:0] en = (en i & {16{op == ‘OP STA}}) | {16{rst}}; 

wire lda = (op == ‘OP LDA) | (op == ‘OP_LDAI); //Load the acc? 
wire en_acc = alu op | lda | en[‘RACC]; 

wire en acch = (alu op & write high) | en[‘RACCH]; 

wire en brd = en[‘RBRD] | (op == ‘OP_BRS); 


wire [15:0] accr = rst ? 16'd0 : acc; 


DFFE #(16) ACC(clk, en_acc, acc_nxt, acc); 

DFFE #(16) ACCH(clk, en_acch, acch_ nxt, acch); 

DFFE #(16) OO(clk, en[*ROO], accr, o0); 

DFFE #(16) Ol1(clk, en[‘RO1], accr, ol); 

DFFE #(16) O2(clk, en[‘RO2], accr, 02); 

DFFE #(16) O3(clk, en[*RO3], accr, 03); 

DFFE #(16) BRD(clk, en brd, brdr, brd); 

DFFE #(16) MA(clk, en[*‘RMA], accr, ma); 

RAM #(16, 16) dataStore(ma, ma, en[‘RMD], accr, mout); 
DFFE #(16) IM(clk, en[‘RIM], accr, im); 

DFFE #(16) TO(clk, en[‘RTO], accr, t0); 

DFFE #(16) T1(clk, en['RT1], acer, tl); 

DFFE #(16) T2(clk, en[‘RT2], acer, t2); 

//IN, not included 

DFFE #(16) PC(clk, 1‘bl, nper, pc); 

Timer #(16) ttimer (clk, rst, en[‘RTIME], acc, tdone) ; 





endmodule // alu 


图 18-21 ”处理 器 的 Verilog 程序 ， 三 部 分 中 的 第 三 部 分 。 在 这 里 我 们 分 配 使 能 信号 并 实例 化 
寄存 器 



























LDAI 0111 
STA BRD #Load branch target 
LDA IN 

STA Ol #01=loop count, from input 

LDAI 0001 

STA TO #Store 1 into TO for dec loop count 
STA T1 #Store 1 into T1 as first num 
#begin loop 

LDA 00 #Acc = last fib 








(insn 7) 








ADD T1 #Add = 2nd to last fib 

STA T2 #T2 = last fib 

LDA 00 

STA Tl #T1 = 2nd to last fib 

LDA T2 

STA OO #00 = T2 (last fib) 

LDA O1 

SUB TO 

STA O1 #01 = O1-1 (next loop iteration) 
BRACC 0100 #Branch if no more iterations 





图 18-22 ”用 我 们 的 简单 处 理 器 计算 斐 波 那 契 数列 的 程序 
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图 18-23 图 18-22 的 斐 波 那 契 程序 运行 在 我 们 的 处 理 器 上 。 寄 存 器 OO 显示 了 当前 斐 波 那 契 数 ， 寄 存 
器 01 保存 程序 还 需要 进行 的 迭代 次 数 。 该 图 还 给 出 了 存储 在 寄存 器 TO. TI A T2 中 的 临 
时 值 


小 结 


在 本 章 中 你 已 经 学 会 了 强大 的 存储 程序 控制 技术 以 及 如 何 用 微 码 实现 有 限 状 态 机 。 

任何 有 限 状 态 机 都 可 以 用 存储 器 (ROM 或 RAM) 中 的 表 存 储 下 一 个 状态 和 输出 函数 来 实 
现 。 所 有 输入 信号 和 当前 状态 组 合 起 来 作为 存储 器 地 址 。 存 储 器 输出 给 定 下 一 个 状态 和 当前 输 
出 信号 。 这 项 技术 通常 需要 一 个 S2' 字 大 小 的 存储 器 ， 这 里 5 是 状态 数 , 是 输入 信号 的 位 数 。 

通过 增加 一 个 序列 发 生 器 来 产生 下 一 个 状态 存储 器 地 址 ， 可 以 将 需要 的 存储 器 大 小 减少 到 
S 个 字 。 序 列 发 生 器 实现 一 系列 的 分 支 指令 ， 该 指令 选择 依次 进入 下 一 个 状态 还 是 分 支 到 分 支 
目标 ， 分 支 目标 由 当前 微 码 字 指 定 ， 并 且 依赖 于 输入 信号 位 的 值 。 多 路 分 支 可 以 通过 基于 输入 
条 件 修 改 分 支 目标 地 址 来 实现 。 

如 果 在 每 次 状态 转换 时 输出 信号 只 有 一 个 子 集 发 生变 化 ,我们 可 以 通过 定义 存储 指令 进 一 
步 缩减 我 们 的 存储 器 需求 。 使 用 这 种 结构 ， 微 码 状 态 机 的 输出 信号 保存 在 一 组 寄存 器 中 。 每 条 
存储 微 指令 更 新 一 个 输出 寄存 器 的 状态 。 其 他 寄存 器 保留 它们 的 原 值 不 变 。 

如 果 我 们 的 微 码 有 重复 序列 ， 我 们 可 以 通过 在 分 支 指令 中 增加 子 程序 调用 和 返回 指 指令 来 减 
小 程序 规模 。CALL 指令 将 调用 之 后 的 指令 地 址 保存 到 指定 的 rupc 寄存 器 中 。 公 共 序 列 执行 
完了 之 后 ，RET 指令 分 支 到 rupc 保存 的 地 址 处 。 


文献 说 明 
微 码 起 源 于 1951 年 ， 由 Maurice Wilkes 在 剑桥 大 学 提出 ， 是 为 了 实现 EDSAC 计算 机 的 控 
制 逻 辑 而 提出 的 【109] 。 从 那 时 开始 微 码 已 经 广泛 应 用 到 许多 不 同类 型 的 数字 系统 中 。 微 码 在 
20 世纪 70 年 代 后 期 非常 流行 ， 主 要 是 用 双 极 型 位 片 芯片 集 来 实现 处 理 器 [78]. 。 如 今 ， 微 码 
仍然 广泛 应 用 于 实现 像 x86 那样 的 复杂 指令 集 [43 ] 。 用 于 为 摩托 罗拉 680000 (最 初 用 于 Ap- 
ple Macintosh 计算 机 的 处 理 器 ) 生成 微 码 的 方法 在 参考 文献 [103] 中 进行 了 介绍 。 
处 理 右 设计 最 流行 的 两 本 书 是 Patterson 和 Hennessy 的 导论 [90] 和 进 阶 【47 ] 。 作 为 另 一 
个 相对 简单 的 处 理 器 的 例子 ，O'Brien 的 《The Apollo Guidance Computer) [87] 概述 了 探 月 计 
算 机 。 
习题 
18.1 改进 的 交通 灯 控 制 器 ，I。 修 改 表 18-1 (为 图 18-1 给 出 的 控制 器 编写 ) 中 的 交通 灯 控 制 器 微 码 ， 
增加 输入 信号 car_ns。 现 在 ， 任 何方 向 的 交通 灯 都 保持 绿灯 亮 ， 直 到 有 表示 在 相反 方向 有 车 过 来 
的 输入 信号 变 为 高 电 平 为 止 。 不 管 是 否 绿灯 方向 还 有 车 ， 这 个 转换 都 会 发 生 。 确 保 绿灯 从 一 个 方 
向 转换 到 另 一 个 方向 的 过 程 中 都 包括 黄 灯 。 
18.2 改进 的 交通 灯 控 制 器 ，I。 使 用 图 18-2 的 微 编 码 FSM， 模 仿 习题 18. 1 的 微 码 。 实 例 化 一 个 FSM 版 
本 ， 确 保有 足够 的 输入 、 输 出 和 状态 位 。 
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改进 的 交通 灯 控 制 器 ，IL。 当 前 方向 没有 车 到 来 而 相反 方向 有 车 到 来 时 ， 为 了 使 信号 灯 改 变 方向 ， 

习题 18. 1 的 程序 必须 改变 多 少 位 数 ? 

微 编 码 自动 售 货 机 。 用 使 用 了 18.2 节 中 的 指令 序列 发 生 器 的 微 编码 控制 器 来 实现 16. 3. 1 节 中 自 

动 售 货机 的 控制 路 径 。 状 态 机 的 输入 、 输 出 信号 是 什么 ? 需要 多 大 的 控制 存储 空间 ? 给 出 这 个 解 

决 方案 的 微 码 。 假 设 控制 器 的 每 一 个 外 部 输入 信和 号 都 保持 高 电 平 ， 直 到 FSM 输出 一 个 nxt 输出 信 

号 脉冲 。 

微 编码 密码 锁 。 用 18.2 节 中 的 微 编 码 控制 器 和 序列 发 生 器 实现 16. 3.2 节 密 码 锁 的 控制 部 分 。 状 

态 机 的 输入 信号 和 输出 信号 有 哪些 ? 需要 多 大 的 控制 存储 空间 ? 给 出 此 实现 方案 的 微 码 。 

SOS 发 光 器 ，I。 写 出 SOS 发 光 器 (习题 17. 11) 的 微 码 。 当 输入 信号 flash 为 高 电 平时 ， 系 统 应 

该 闪烁 SOS 序列 一 一 3 次 短 闪 烁 〈 每 次 闪烁 1 个 时 钟 周 期 ) ， 紧 接着 3 次 长 闪烁 〈 每 次 闪烁 4 个 时 

钟 周期 ) ， 接 下 来 再 3 次 短 闪 烁 。 字 符 之 间 的 间隔 应 该 为 一 个 时 钟 周期 。 一 条 SOS 中 字符 之 间 的 间 

隔 应 该 为 3 个 时 钟 周期 。 前 一 条 SOS 和 后 一 条 SOS 之 间 的 间隔 应 该 为 7 个 时 钟 周 期 。 当 输入 信号 

为 低 电 平时 ， 发 光 器 应 该 重 置 到 复位 状态 。 用 18. 1 节 的 微 编码 FSM。 保留 发 光 器 原 设计 ， 不 进行 

因 式 分 解 。 

SOS 发 光 器 ，II。 修 改 18. 1 节 和 习题 18.6 的 微 编码 FSM 和 微 码 ， 作 为 控制 模块 和 你 设计 的 数据 通 

路 进行 连接 。 给 出 此 数据 通路 的 框图 ， 需 要 在 这 两 者 和 微 码 之 间 进 行 信 号 连接 。 

SOS KAS, Hl. Bi J eH 18.7 的 SOS BGAN Verilog 程序 (数据 通路 + 微 编码 FSM ) ， 并 对 程 

序 进 行 验证 。 

SOS 发 光 器 ，IV。 用 18. 2 节 的 序列 微 编码 FSM 代替 18. 1 节 的 FSM， 编 写 习 题 18.7 的 SOS 发 光 器 

的 微 码 。 

SOS 发 光 器 ，V。 用 18.5 节 的 支持 子 程序 的 微 编码 FSM， 编 写 习题 18.7 的 SOS 发 光 器 的 微 码 。 

系统 中 每 个 字符 应 该 是 独立 的 子 程序 。 

字符 串 比 较 ，I。 本 习题 和 习题 18. 12 ~ 习题 18. 14 通过 建立 一 个 微 编码 状态 机 来 实现 ASCII 码 字 

符 串 比较 的 问题 。 原 始 框图 如 图 18-24a 所 示 。 时 序 如 图 18-24b 所 示 。 通 过 声明 一 个 输入 信号 start 

来 启动 字符 串 比较 。 比 较 完 整个 字符 串 之 后 ， 如 果 找 到 了 匹配 字符 串 ， 输 出 信号 match 有 效 ， 直 到 

start 信号 再 次 出 现 脉冲 。 如 果 字 符 串 终止 符号 到 达 (end =1), 信号 fail 应 该 保持 有 效 状态 ， 直 到 

重新 启动 。 微 码 状 态 机 声明 c_nxt 信号 ， 用 于 从 输入 端 请 求 每 一 个 新 的 字符 。ROM 向 输入 模块 提供 

信号 s_c 来 匹配 当前 字符 。 输 入 逻辑 模块 输出 三 个 信号 : start, end (c =8b0). match (c=s_c)。 

(a) 如 果 匹 配 序列 为 “11ABC"”， 画 出 状态 图 。 

(b) 画 出 没有 序列 发 生 器 ( 见 表 18-1) 的 微 码 表 。 为 每 一 个 状态 和 输入 信号 组 合 ， 指 出 next、 
nom, nf、s_c 和 c_nxt 的 值 。 

(c) 写 出 该 FSM 的 Verilog 程序 。 

字符 串 比 较 ，I。 假 设 字符 串 为 “FLIPFLOP” (考虑 从 第 二 个 工 开 始 的 所 有 转换 )， 重 复习 

题 18.11。 

字符 串 比 较 ，II。 在 习题 18.12 的 字符 串 比 较 器 中 加 入 序列 发 生 器 。 你 可 以 定义 自己 的 分 支 

指令 。 

(a) 重新 画 出 图 18-24a 的 框图 ， 使 其 包含 序列 发 生 需 。 

(b) 定义 并 列 出 你 要 用 来 排序 状态 的 分 支 指令 。 

(c) 写 出 匹配 “ABC” 和 “FLIPFLOP” 的 ROM 表 ( 见 表 18-5)。 

(d) 更 新 Verilog 程序 ， 使 其 包含 序列 发 生 器 。 

字符 串 比 较 ，IV。 修 改 序列 发 生 器 ， 使 其 增加 一 个 计数 器 ， 用 来 指示 当前 匹配 的 字符 在 字符 串 中 

的 位 置 。 更 新 框图 和 Verilog 程序 ， 实 现 此 计数 器 。 

有 调用 /返回 的 微 码 控制 器 。 编 写 Verilog 程序 实现 支持 调用 /返回 指令 的 控制 器 ， 并 对 其 进行 

验证 。 

多 级 调用 /返回 。 描 述 一 个 控制 器 ， 它 能 够 对 调用 /返回 指令 进行 三 级 深度 的 调用 。 这 里 允许 子 程 

序 调用 子 程序 ( 称 作 子 程序 ) o 
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b) 
图 18-24 基本 字符 串 比 较 引 擎 的 微 码 模块 a) 和 波形 图 b)。 输 入 字符 。 和 字符 串 


“ABC” 进 行 匹配 。 如 果 匹 配 ， 匹 配 输出 信号 有 效 。 如 果 字 符 串 到 达 结 束 符号 
“0 7" ， 失 败 输出 信号 有 效 


18.17 编写 程序 ，I。 为 18.6 节 的 简单 处 理 器 编写 程序 ， 将 ASCII FAE “HELLO WORLD” 放 到 输出 


寄存 器 01 中 ,9 显示 每 个 字符 花费 的 周期 数量 不 是 问题 ， 只 要 01 中 的 数值 序列 能 够 拼写 
H “HELLO WORLD” , 


18.18 编写 程序 I。 将 习题 18. 17 的 程序 进行 汇编 一 一 转换 成 一 系列 二 进 制 指令 。 用 我 们 提 
BEA Verilog 处 理 器 运行 它 。 


18.19 编写 程序 ，IHI。 为 18.6 节 的 处 理 器 编写 程序 ， 计 算 存 储 器 中 前 32 个 数值 (地 址 
0 ~31) 的 平均 值 ， 用 寄存 器 01 输出 计算 结果 。 


© 在 ASCI 码 中 ,单词 “HELLO”( 以 空格 结尾 ) 对 应 于 十 六 进 制 值 0x48 0x45, 0x4C, 0x4F, 0x20, 
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时 序 电路 实例 





本 章 给 出 了 一 些 时 序 电路 的 附加 实例 。 我 们 开始 用 一 个 简单 的 有 限 状 态 机 来 复习 如 何 根据 
设计 规格 画 出 状态 图 以 及 如 何 用 Verilog 编程 实现 简单 的 FSM， 这 个 状态 机 用 因数 3 来 降低 输 
入 端 1 的 数值 。 然 后 我 们 实现 一 个 SOS 探测 器 来 复习 一 下 有 限 状 态 机 的 分 解 。 接 下 来 我 们 重新 
考虑 9.4 节 的 井 字 棋 游 戏 ， 构 建 数据 通路 的 时 序 电路 ， 用 我 们 之 前 开发 的 组 合 移动 发 生 器 对 阵 
它 自己 进行 游戏 。 通 过 构建 一 个 赫 夫 曼 编 码 器 和 译 码 器 ， 我们 阐述 了 如 何 使 用 表 驱 动 时 序 电 
路 ， 以 及 如 何 用 像 计数 器 和 移 位 寄存 器 那样 的 时 序 基础 单元 组 成 电路 。 编 码 器 同 计数 器 和 移 位 
寄存 器 一 起 使 用 表 查 找 ， 而 译 码 器 遍历 存储 在 表 中 的 树 形 数 据 结构 。 


19.1 3 分 频 计数 器 


一 节 我 们 将 设计 一 个 有 限 状 态 机 ， 每 当 输 入 信号 保持 三 个 周期 的 高 电 平时 就 在 输出 端 输 

一 个 周期 的 高 电 平 信号 。 更 具体 地 说 ,我 们 的 FSM 只 有 单独 的 一 个 输入 信号 in 和 单独 的 一 
个 输出 信号 out 。 当 检测 到 输入 信号 in 出 现 三 个 周期 的 高 电 平时 (或 6 个 、9 个 等 ) 输出 信 
号 out 将 出 现 一 个 周期 的 高 电 平 。 该 FSM 将 输入 端的 脉冲 数量 除 以 3。 而 不 是 输入 端 表 示 的 
二 进 制 数 除 以 3。 0 0 

这 个 状态 机 的 状态 图 如 图 19-1 所 示 。 最 初 ， 我 们 似乎 (_ EE 
oq. :个 状态 实现 这 个 状态 机 ， SRT, SIR E 34 rst £$ 1 4 

状态 。 我 们 需要 用 状态 A 到 D 来 区 分 到 目前 为 止 输入 端 已 
经 保持 高 电 平 0、1、2 、3 个 周期 。 状 态 机 重 置 为 状态 A。 
状态 机 保持 这 个 状态 ， 直 到 输入 端 在 时 钟 上 升 沿 到 来 时 变 0 
为 高 电 平 ， 这 时 候 状态 前 进 到 状态 B。 第 二 个 高 电 平 输入 
使 得 状态 机 状态 变 为 C， 第 三 个 高 电 平 输入 使 得 状态 机 状 3 t° 
态 变 为 D, 这 时 候 输 出 端 保持 一 个 周期 的 高 电 平 。 我 们 不 
能 简单 利用 第 三 个 高 电 平 输入 信号 来 返回 状态 A， 这 是 因 
为 我 们 需要 区 分 是 否 已 经 看 到 了 三 个 周期 的 高 电 平 输 入 还 ”图 19-1 3 分 频 计数 器 FSM 的 状态 


是 根本 没有 看 到 高 电 平 输入 ， 在 看 到 三 个 周期 的 高 电 平 信 图 。4 个 状态 表示 到 目前 
号 的 情况 下 ， 输 出 信号 为 高 电 平 。 为 止 输入 信号 变 为 高 电 平 

FSM 通常 在 一 个 周期 之 后 退出 状态 D。 这 个 周期 时 出 之 后 ,，0、1、2、3 个 周期 
现 的 输入 信号 决定 了 下 一 个 状态 值 。 ee 的 状态 


平 ， 则 状态 机 前 进 到 状态 A， 在 下 一 次 输出 之 前 等 待 新 的 三 个 高 电 平 输入 。 如 果 输 入 信号 为 高 

电 平 ， 这 个 高 电 平 将 记 作 新 的 三 个 高 电 平 输入 中 的 一 个 ， 因 此 状态 机 直接 进入 状态 B， 接 着 再 

等 待 两 个 高 电 平 输 入 。 |414| 
这 个 3 分 频 FSM AY Verilog 程序 如 图 19-2 所 示 。 用 一 条 case 语句 来 实现 下 一 个 状态 函数 ， 

包括 复位 操作 。 单 独 的 一 条 assign 语句 实现 输出 函数 ， 使 得 输出 信号 在 状态 DD 输出 高 电 平 。 用 

于 定义 状态 和 其 宽度 的 定义 语句 没有 显示 出 来 。 对 此 Verilog 模型 进行 仿真 的 波形 如 图 19-3 所 示 。 





名” 只 需要 三 个 状态 的 方法 见习 题 19. 3。 
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// 除 以 3 的 FSM 

// in 一 一 当 输 入 高 电 平 时 状态 数 增加 

// ”out 一 一 输入 信号 每 出 现 三 个 周期 的 高 电 平 ， 输 出 信号 出 现 一 个 周期 的 高 电 平 
// 在 in 第 三 个 高 电 平 周 期 之 后 out 第 一 次 变 为 高 电 平 








module Div3FSM(clk, rst, in, out) ; 
input clk, rst, in ; 
output out ; 


wire [‘AWIDTH-1:0] state ; // 当前 状态 
reg [‘AWIDTH-1:0] next ; // 下 一 个 状态 








// 实例 化 状态 寄存 器 
DFF #(‘AWIDTH) state _reg(clk, next, state) ; 


// 下 一 个 状态 函数 
always @(*) begin 


case (state) 


‘Ay next = rat 2 ‘A z (in ? Bi SA) ç 
‘B: NeXt = rst ? As: (in ? sC ; “B) 3 
WC: mext = ESE 7 A: (iH 2 ‘Di se "O y 
‘Di: next = ret ? “A : (in Y Bi “A 
default: next = ‘A ; 
endcase 

end 

// 输出 函数 

assign out = (state == 'D) ; 

endmodule 





图 19-2 3 分 频 计 数 器 的 Verilog 描述 
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/Div3TB/rst 
/Div3TB/out 
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分 频 计 数 器 的 仿真 波形 


19.2 SOS 探测 器 


莫 尔 斯 码 曾经 广泛 应 用 于 电报 和 无 线 电 通信 ， 其 将 字母 、 数 字 和 一 些 标点 符号 表示 为 用 点 
和 破 折 号 表示 的 开关 信号 。 空 格 用 来 分 隔 符号 。 点 是 短 周期 的 开 信号 (on) ， 破 折 号 (dash) 
是 长 周期 的 开 信号 (on)。 一 个 符号 中 的 点 和 破 折 号 用 短 周期 的 关 信 号 (off) 来 分 隔 ， 空 格 是 
长 周期 的 关 信号 (off) 。 通 用 紧急 求救 码 SOS 用 莫 尔 斯 码 表 示 为 三 个 点 (S) ， 一 个 空格 ， 三 个 
RAS (0) ， 一 个 空格 ， 三 个 点 〈 第 二 个 S)。 

考虑 完成 一 个 任务 ， 建 立 一 个 有 限 状 态 机 来 检测 输入 端 接 收 到 的 SOS 信和 号。 假设 用 一 个 周 
期 高 电 平 的 输入 信号 表示 点 ， 用 三 个 周期 高 电 平 的 输入 信号 表示 破 折 号 ， 用 一 个 周期 低 电 平 的 
输入 信号 来 分 隔 一 个 符号 内 的 点 和 破 折 号 ， 用 三 个 或 更 多 个 周期 低 电 平 的 输入 信号 表示 空格 。 
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注意 输入 信和 号 保持 两 个 周期 的 高 电 平 或 低 电 平 状 态 为 非法 情况 。 根 据 这 些 定义 ， 一 条 合法 的 
SOS 字符 串 应 该 为 101010001110111011100010101000。 

我 们 可 以 用 一 个 平面 状态 机 来 构建 SOS 探测 器 ， 状 态 图 如 图 19-4 Bras. FSM 复位 到 状态 
R。 状 态 S11 到 S18 检测 到 第 一 个 “S” 以 及 相关 的 空格 。 状 态 01 到 011 检测 到 “0”， 状 态 
012 到 014 检测 到 紧 随 “0” 的 空格 。 最 后 状态 S21 到 S28 检测 到 第 二 个 “S” 和 随后 的 空格 。 
状态 S28 输出 “1” 表 示 检 测 到 了 SOS, 

为 了 清晰 起 见 ， 图 19-4 省 略 了 许多 转换 过 程 。 沿 水 平 路 径 从 状态 R 到 状态 528 的 转换 过 
程 表示 当 检 测 到 SOS 时 发 生 的 转换 。 如 果 这 个 路 径 上 的 任何 点 当 希 望 出现 0 而 实际 上 检测 到 1 
时 ， 状 态 机 转换 到 状态 E11。 类似 地 ， 如 果 我 们 希望 检测 到 1 而 实际 检测 到 0 时 ， 状 态 机 转换 到 
状态 2。 这 些 转换 显示 在 图 的 第 一 行 (通过 方块 下 和 El)， 省略 部 分 是 为 了 避免 使 图 凌乱 。 
状态 El 到 E3 是 错误 处 理 状 态 ， 错 误 条 件 之 后 等 待 一 个 时 间 间 隔 ， 然 后 重启 检测 过 程 。 

从 状态 01 到 S12 的 转换 过 程 处 理 输入 信号 包含 字符 串 SSOS 的 情况 。 检 测 到 第 一 个 S 之 
后 ， 我 们 希望 检测 到 字符 0， 但 是 却 接收 到 了 第 二 个 字符 S。 如 果 我 们 在 状态 01 接收 到 0 之 后 
转换 到 状态 ZE2 ， 我 们 将 错过 第 二 个 S， 进 而 探测 不 到 字符 串 SOS。 相 反 我 们 必须 识别 出 点 并 转 
换 到 状态 S12, 

为 了 允许 紧 接 的 SOS 在 最 小 空间 间隔 被 检测 到 ， 我 们 需要 从 S28 到 S11 的 转换 过 程 (表示 
为 方块 D) 。 在 状态 S28 检测 到 SOS 以 及 后 续 的 空格 后 ， 下 一 个 1 成 为 下 一 个 SOS 的 第 一 个 点 ， 
必须 通过 转换 到 状态 S11 来 识别 。 

当 图 19-4 的 平面 FSM 工作 时 ， 该 FSM 不 是 一 个 很 好 的 解决 方案 ， 有 以 下 几 个 原因 。 首 
先 ， 它 不 是 模块 化 的 。 如 果 我 们 要 将 点 的 定义 改变 为 输入 信和 号 保持 1 个 或 2 个 周期 高 电 平 ， 这 
时 候 平面 状态 机 需要 改变 8 个 地 方 (每 个 地 方 识别 出 一 个 点 ) 。 类 似 地 ， 破 折 号 或 空格 的 定义 
改变 了 ,也 需要 有 全 局 的 改变 来 适应 。 同 时 ， 如 果 我 们 检测 的 序列 不 是 SOS 了 ， 而 变 成 了 
ABC， 那 么 状态 机 就 需要 完全 重新 做 。 第 二 ， 状 态 机 很 大 ，34 个 状态 ， 如 果 点 和 破 折 号 定义 更 
加 复杂 则 状态 机 将 更 庞大 。 最 后 ， 状 态 机 的 某 些 方面 是 敏感 的 ， 比 如 从 状态 01 到 S12 的 转换 。 
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图 19-4 用 一 个 平面 FSM 实现 SOS 探测 器 的 状态 图 。 方 块 表示 连接 


SOS 状态 机 是 进行 分 解 的 最 好 候选 。 我 们 可 以 构建 FSM 来 检测 点 、 破 折 号 和 空格 ， 然 后 用 
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这 些 FSM 的 输出 信和 号 来 构建 检测 S 和 0 AY FSM。 最 后 ， 用 一 个 简单 的 顶层 FSM 来 检测 SOS. 
分 解 的 SOS 探测 器 FSM 的 框图 如 图 19-5 所 示 。 输 入 信号 位 数据 流 (序列 ) 输入 到 3 个 元 素 检 
测 FSM 一 一 点 、 破 折 号 和 空格 。 这 些 FSM 每 个 都 有 两 个 输出 信号 : 一 个 表示 检测 到 该 元 素 ， 
一 个 表示 当前 输入 序列 可 能 是 元 素 的 一 部 分 。 例 如 ， 当 检测 到 点 时 ， 点 FSM 输出 isDot 信和 号， 
当当 前 序列 可 能 是 一 个 点 时 输出 cbDot 信号 ， 但 是 在 决定 之 前 需要 一 个 额外 的 输入 。 

这 3 个 元 素 探测 器 的 6 个 输出 信号 传输 到 一 对 字符 探测 器 ， 分 别 探测 字符 $S 和 0。 像 元 素 
探测 器 一 样 ， 每 一 个 字符 探测 器 也 有 is 和 could 两 个 输出 信号 。 这 两 个 字符 探测 器 的 4 个 输出 

418| ”信号 再 输入 到 顶层 的 SOS FSM， 当 检测 到 SOS 时 进行 显示 。 






SOS true 


图 19-5 对 SOS 探测 器 进行 分 解 的 框图 。FSM 的 第 一 列 检 测 点 、 破 折 号 和 空格 。 第 二 列 检 
测字 符 S 和 0。 最 后 的 SOS FSM 检测 SOS 序列 。 每 一 个 子 状态 机 有 两 个 输出 信 
号 : 其 中 一 个 指示 检测 到 预期 的 符号 〈 例 如 ，isS) ， 另 一 个 指示 当前 序列 可 能 是 
预期 符号 的 一 个 前 级 (例如 ，cbS) 


图 19-6 显示 了 检测 元 素 点 、 破 折 号 、 空 格 的 三 个 FSM。 点 FSM 复位 到 状态 0。 根 据 在 输 
和信 端 检测 到 1， 通过 输出 信号 cb 有 效 并 转换 到 状态 Dot 表明 当前 序列 可 能 为 点 。 在 状态 Dot, 
如 果 输 入 端 输 入 0， 则 检测 到 点 ，is 输出 有 效 并 且 状 态 机 返回 到 状态 0。 注 意 当 输出 信号 is 有 
效 时 ，cb 输出 信号 也 有 效 。 如 果 在 状态 Dot 检测 到 输入 1， 则 状态 机 进入 状态 1， 等 待 输入 0。 
破 折 号 和 空格 状态 机 以 类 似 方式 进行 工作 。 





图 19-6 元 素 有 限 状态 机 。a) 点 ，b) MIE, c) 空格 。 当 当前 序列 可 能 (cb) 是 元 素 
前 级 时 或 者 检测 到 元 素 时 〈is) ， 每 个 状态 机 都 有 相应 的 输出 
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字符 5 的 字符 FSM 如 图 19-7 所 示 。 状 态 机 复位 到 状态 OTH (其 他 ) ， 该 状态 也 是 默认 
(def 转换 的 目标 状态 ， 其 包含 了 意外 输入 。 当 检测 空格 时 ， 状 态 机 进入 状态 SPC。 检 测 到 第 一 
个 点 则 进入 状态 D1 ， 接 下 来 的 点 使 得 状态 机 进入 状态 D2 和 状态 D3。 在 状态 D3 检测 到 一 个 空 
格 则 使 状态 机 返回 到 状态 SPC 并 且 信号 is 有效， 表示 已 经 检测 到 了 字符 S. 


T aera way oN 


cb=cbDotjcbSpace cb=cbDot cb=cbDot cb=cbDot 


图 19-7 S&M] FSM 的 状态 图 


如 果 在 序列 从 SPC 经 过 D1 、D2、D3 并 返回 SPC 过 程 中 的 任何 点 ， 输 入 信号 可 能 不 是 元 素 
期 待 的 值 ( 例 如， 如 果 cbDot 在 状态 D1 时 输入 为 0) ， 然 后 状态 机 将 返回 到 状态 OTH。 这 就 是 
为 什么 在 元 素 探测 器 中 我 们 需要 could-be 输出 。 这 样 做 允许 我 们 检测 我 们 寻找 的 元 素 之 间 的 非 
法 元 素 。 例如， 考虑 输入 序列 00010110101000。 状 态 机 检测 到 空格 000， 第 一 个 点 10， 然 后 在 
非法 元 素 110 时 ， 由 于 cbDot 在 检测 到 第 二 个 1 时 变 为 低 电 平 ， 使 得 状态 机 返回 到 状态 OTH。 
如 果 我 们 只 是 等 待 isDot 信号 ， 由 于 这 个 序列 有 三 个 点 ,我 们 将 错误 地 认为 它 是 一 个 S 符号 。 
没有 监听 信号 cbDot 我 们 将 不 会 发 现 这 三 个 点 不 是 连续 的 ， 因 此 不 是 字符 S, 

图 19-8 给 出 了 主 SOS 探测 FSM， 只 考虑 三 个 状态 。 该 
状态 机 在 检测 到 S 之 前 一 直 保持 状态 ST (启动 )， 然 后 状 
态 机 进入 状态 S1。 接 下 来 如 果 检 测 到 0， 则 状态 机 从 状态 
SI 进入 状态 0。 然 而 如 果 在 状态 SI 的 任何 点 输入 信号 ebO 
变 为 0， 表 示 在 字符 S 和 字符 0 之 间 出 现 非法 序列 ， 状 态 
机 返回 到 状态 ST。 如 果 状 态 机 在 状态 0 检测 到 第 二 个 S， 图 19-8 主 SOS 检测 FSM 的 状态 图 
则 使 得 其 输出 信号 i 有 效 ， 检 测 到 SOS， 返 回 到 状态 ST。 如 果 输 入 信号 cbs 在 状态 0 变 为 低 电 
平 ， 在 字符 0 和 字符 S 之 间 检 测 到 非法 序列 ， 状 态 机 返回 状态 ST， 但 是 没有 检测 到 SOS. 

图 19-9 的 波形 显示 了 分 解 的 SOS 探测 器 的 操作 。 波 形 显示 了 两 个 正确 的 SOS 检测 ， 以 及 
它们 之 间 的 一 个 SOT (T 为 一 个 单独 的 破 折 号 ) 。 注 意 每 一 个 元 素 的 信号 cb 和 信号 is BIB, fa 
括 字符 元 素 $S 和 0， 以 及 SO0S 本 身 。 在 T 破 折 号 的 第 二 个 1, chDot 变 为 低 电 平 ， 引 起 cbS 和 
chSOS 依次 变 为 低 电 平 (组 合 起 来 ) 。 720 

对 SOS 探测 器 进行 分 解 使 其 变 为 一 个 更 简单 的 系统 ， 更 容易 进行 修改 和 维护 。 不 是 一 个 
34 状态 的 脆弱 的 、 巨 大 的 状态 机 ， 而 是 将 全 部 20 个 状态 划分 为 6 个 小 的 简单 的 FSM。 分 解 的 
状态 机 中 ， 最 大 的 单独 PSM 有 5 个 状态 。 如 果 我 们 需要 修改 规格 ， 将 点 的 定义 改变 为 连续 的 1 
个 或 2 个 1， 我 们 只 需要 对 点 FSM 做 一 处 简单 改变 。 
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FE 9. 4 节 中 我 们 设计 了 一 个 组 合 模块 生成 井 字 棋 游 戏 中 的 位 置 移动 。 在 这 一 节 中 我 们 将 用 
这 个 模块 作为 时 序 系统 的 一 个 组 件 ， 该 时 序 系统 将 对 阵 它 自 己 玩 井 字 棋 游戏 。 

该 系统 的 框图 如 图 19-10 所 示 。 系 统 的 状态 保存 在 图 左边 的 三 个 寄存 器 中 。9 位 的 寄存 器 
Xreg 和 Oreg 分 别 保留 反映 X 和 0 当前 位 置 的 位 图 。1 位 的 xplays 寄存 器 表示 接 下 来 轮 到 谁 玩 












O 对 此 分 解 后 的 SOS 探测 器 进行 的 一 些 实际 修改 见习 题 19.4 和 习题 19.5. 
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图 19-9 分 解 的 SOS 探测 器 的 操作 波形 


儿 ， 接 下 来 X 玩 时 为 真 ， 接 下 来 O 玩 时 为 假 。 图 中 没有 显示 复位 。Xreg 和 Oreg 复位 状态 为 全 
零 ; xplay 复位 状态 为 真 。 
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图 19-10 使 用 9.4 节 中 的 移动 发 生 模块 的 井 字 棋 游 戏 系统 的 框图 


当 轮 到 X 玩 儿 时 (xplays =1) ， 多 路 选择 器 直接 将 Xreg 送 到 移动 发 生 器 的 xin 输入 端 ， 将 
Oreg 送 到 其 oin 输入 端 。 移 动 发 生 器 在 xout 端 产生 下 一 个 移动 ， 这 时 候 OReg 和 当前 X 的 位 置 
生成 新 的 X 位 置 并 在 周期 结束 时 保存 回 寄 存 器 Xreg 中 。Xreg 的 写 人 操作 由 信号 xplays 进行 使 
能 控制 。 当 xplays 为 假 时 ， 多 路 选择 器 切换 移动 发 生 器 的 输入 信和 号， 为 0 生成 一 次 移动 ， 并 在 
周期 结束 时 将 本 次 移动 写 回 Oreg 中 。 
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井 字 棋 游 戏 系统 的 Verilog 描述 如 图 19-11 所 示 。 在 声明 三 个 状态 寄存 器 之 后 ， 用 分 配 语句 
在 每 个 周期 触发 xplays 信号 。 在 移动 发 生 器 的 参数 列表 中 ， 输 入 多 路 选择 器 用 选择 语句 实现 。 
两 条 assign 语句 计算 Xreg 和 Oreg 的 下 一 个 状态 。 这 些 语 句 包含 位 置 移动 和 前 边 状 态 的 或 操作 。 





// 时 序 井 字 棋 游 戏 
// 与 自己 对 阵 


module SeqTic(clk, rst, xreg, oreg, xplays) ; 
input clk, rst ; 
output [8:0] xreg, oreg ; 
output xplays ; 


wire [8:0] nxreg, noreg, move ; // 下 一 个 状态 
wire nxplays ; // 下 一 个 状态 


// 状态 

DFF #(9) x(clk, nxreg, xreg) ; 
DFF #(9) o(clk, noreg, oreg) ; 
DFF xp(clk, nxplays, xplays) ; 


// x 先 玩 儿 ， 然 后 轮换 
assign nxplays = rst ? 1 : “xplays ; 


// 移动 发 生 器 ， 多 路 选择 输入 信号 ， 当 前 游戏 者 为 x 


TicTacToe movGen(xplays ? xreg : oreg, xplays ? oreg : xreg, move) ; 


// 更 新 当前 游戏 者 
assign nxreg = rst ? 0 : (xreg | (xplays ? move : 0)) ; 


assign noreg rst ? 0 : (oreg | (xplays ? 0 : move)) ; 


endmodule 








图 19-11 FPS RLU 385689 Verilog 描述 


19.4 赫 夫 曼 编 码 / 译 码 


赫 夫 曼 编码 是 一 种 粹 编码 ， 它 用 位 串 为 字母 表 中 的 每 个 字符 进行 编码 。 使 用 频率 高 的 字符 
用 短 的 位 串 进行 编码 ， 很 少 使 用 的 字符 用 长 的 位 串 进 行 编码 。 为 了 能 够 区 分 出 短 位 串 和 长 位 串 
的 前 半 部 分 ， 要 求 每 个 短 位 串 不 能 是 任何 长 位 串 的 前 缀 。 最 终 的 结果 是 实现 数据 压缩 ;也 就 是 
说 ， 典 型 的 符号 序列 用 这 种 方法 进行 编码 ， 比 所 有 符号 都 用 相同 位 数 进行 编码 需要 的 位 数 
更 少 。 


19.4.1 赫 夫 曼 编 码 器 


在 这 个 例子 中 ， 我 们 将 为 字母 表 中 的 字母 A ~Z 构建 一 个 赫 夫 曼 编码 器 和 译 码 器 。 编 码 器 
的 输入 信号 是 一 个 5 位 编码 ， 其 中 A =1，Z=26。? 为 了 避免 输入 字符 过 快 ， 超 出 编码 器 的 处 理 
能 力 ， 我 们 的 编码 器 生成 一 个 输入 就 绪 (irdy) 信号 表示 编码 器 准备 好 了 接收 下 一 个 输入 字 





日 ”这 对 应 于 大 写字 母 和 小 写字 母 的 ASCII 编码 的 低 5 位 
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符 。 输 出 信号 是 字符 进行 编码 后 的 连续 的 位 流 。 为 了 让 译 码 器 容易 找到 位 流 的 起 始 位 置 ， 编 码 
器 还 生成 一 个 输出 有 效 信号 (oval) 表示 输出 位 流 有 效 。 显 示 编 码 器 输入 信号 和 输出 信号 的 杠 


图 如 图 19-12 所 示 。 

图 19-13 给 出 了 我 们 将 用 作 例 子 的 编码 的 树 形 
图 。 从 树 形 图 根部 开始 到 一 个 字符 的 路 径 给 出 了 该 
字符 的 编码 。 例 如 字符 上 的 路 径 通过 右 、 左 、 左 到 
达 ， 因 此 表示 为 三 位 字符 串 100. FIT J 的 路 径 通 
过 7 次 向 左 然后 两 次 向 右 到 达 ， 因 此 表示 为 9 位 字 
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FFER 000000011。 像 了 和 那样 出 现 频 率 高 的 字符 
只 用 3 位 表示 。 而 像 Z、Q、X #lJ ARREARS Hi BAY 
字符 用 9 位 表示 。 用 树 形 图 表示 编码 ， 能 够 很 清楚 
地 表明 用 于 表示 一 个 符号 的 短 字 符 串 不 是 表示 男 一 
个 符号 的 长 字符 串 的 前 级 ， 这 是 因为 树 形 图 的 每 个 
叶子 结 点 都 是 到 达 此 叶子 结 点 的 路 径 的 终点 。 


图 19-12 ” 赫 夫 曼 编码 器 的 原理 图 符号 。 每 
当 indy 信号 变 为 高 电 平时 ， 编 码 
器 在 输入 端 in 接收 一 个 5 位 字 
符 ， 并 且 当 oval 为 高 电 平时 ， 在 
输出 端 out 产生 串 行 输出 位 流 





图 19-13 ”用 二 进 制 树 表 示 的 字母 表 的 赫 夫 曼 编码 。 从 树 根 开始 ， 向 左 的 分 支 表示 0， 向 右 
的 分 支 表 示 1。 因 此 字符 W 通过 序列 左 、 左 、 左 、 右 、 左 到 达 ， 编 码 表示 
为 00010 


赫 夫 曼 编码 器 的 框图 如 图 19-14 所 示 。5 位 输入 寄存 器 保存 当前 符号 ， 并 且 每 当 irdy 信号 
有 效 时 载 人 一 个 新 的 符号 。 符 号 用 于 对 存储 每 个 符号 相关 的 字符 串 和 字符 串 长 度 的 ROM 进行 
编 址 。 例 如 ，ROM 为 符号 了 存储 字符 串 0011001000000。 这 表明 表示 了 的 字符 串 长 度 为 3 位 ， 
这 3 位 为 001。 由 于 最 大 长 度 字符 串 为 9 位， 我们 用 4 位 表示 长 度 , 用 9 位 表示 字符 串 内 容 。 
少 于 9 位 的 字符 串 在 9 位 的 字段 中 是 左 对 齐 的 ， 因 此 可 以 把 它们 向 左边 移出 。 


out 





图 19-14 赫 夫 曼 编 码 器 的 框图 。ROM 存储 每 个 字符 的 长 度 和 字符 串 。 当 移动 操作 移出 字 
符 串 时 ， 计 数 器 对 长 度 进行 减 计数 


由 信号 indy 将 新 的 符号 载 人 到 输入 寄存 器 ， 一 个 周期 之 后 ， 信 和 号 load 有 效 ， 将 跟 那 个 符号 
相关 的 长 度 和 字符 串 载 人 计数 器 和 移 位 寄存 器 中 。 然 后 当 移 位 寄存 器 将 数据 位 移动 到 输出 端 时 
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计数 器 开始 进行 减 计 数 。 当 计数 器 计数 到 2 时 (倒数 第 二 位 )，irdy 有 效 ， 将 下 一 个 符号 载 人 
输入 寄存 器 中 ， 当 计数 器 计数 到 1 时 (此 符号 的 最 后 一 位 ) load 有 效 ， 将 下 一 个 符号 的 长 度 
和 字符 串 载 人 计数 器 和 移 位 寄存 器 中 。 

赫 夫 曼 编码 器 的 Verilog 实现 如 图 19-15 所 示 。 我 们 用 16. 1.2 节 中 的 加 一 / 减 一 / 载 人 计数 
器 来 实现 计数 器 ， 用 16. 2. 2 节 中 的 左 移 / 右 移 / 载 人 移 位 寄存 器 来 实现 移 位 器 。 需 要 注意 的 是 ， 
虽然 我 们 不 用 计数 器 的 加 一 计数 功能 和 移 位 寄存 器 的 右 移 功能 ， 但 是 综合 器 将 把 未 使 用 的 逻辑 
优化 掉 ， 因 此 这 仍然 是 一 个 高 效率 的 实现 方法 。 表 在 模块 HuffmanEncTable 中 实现 (没有 

显示 ) ， 用 一 条 庞大 的 case 语句 进行 编程 。 





// RK Fa B 

// ”in 一 一 字符 'a' 到 'z' 一 一 必须 准备 好 

// irdy 一 一 当 此 信号 为 高 电 平时 接收 当前 输入 字符 

// out 一 一 赫 夫 曼 编 码 的 串 行 输 出 位 

// oval 一 一 输出 有 效 位 时 此 信号 有 效 

/? 

// 输入 字符 访问 一 个 表 ， 每 个 表 项 包含 4 位 的 长 度 和 9 位 的 数据 位 


module HuffmanEncoder(clk, rst, in, irdy, out, oval) ; 
input clk, rst ; 
input [4:0] in ; 
output irdy, out, oval ; 


wire [3:0] length, count ; 

wire [8:0] bits, obits ; 

wire [4:0] char ; 

wire dirdy ; // irdy€iR—+- B| JJj——# À iF 3 8 Ru 45 45% 4 38 


wire oval ; 





// 控制 部 分 
wire out = obits[8] ; // MSB 为 输出 
wire irdy = “rst & ((count == 2) | (count == 0)) ; // 为 0 时 复位 


wire noval = “rst & (dirdy | oval) ; // 载 入 后 输出 有 效 周 期 





// 模块 实例 化 
UDL_Count2 #(4) cntr(.clk(clk), .rst(rst), .up(1’b0), .down( dirdy), 
-load(dirdy), .in(length), .out(count)) ; 
LRL Shift_Register #(9) shift(.clk(clk), .rst(rst), .left(~dirdy), 
-right(1'b0O), .load(dirdy), .sin(1’'b0), .in(bits), .out(obits)) z 


DFF #(5) in_reg(clk, irdy ? in : char, char) ; 
DFF #(1) irdy reg(clk, irdy, dirdy) ; 

DFF #(1) ov_reg(clk, noval, oval) ; 
HuffmanEncTable tab(char, length, bits) ; 


endmodule 








FA 19-15 WRR AMSAT Verilog 描述 


BR E 48 BJ lig EAR He aj 8. BJ. FT AT irdy 信号 为 2 或 者 0 一 一 0 用 于 
复位 后 载 人 第 一 个 符号 。 然 后 一 条 DFF 语句 使 得 indy 信号 延迟 一 个 周期 ， 用 于 产生 信号 dirdy, 
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该 信号 用 于 载 人 计数 器 和 移 位 器 。 一 行 代 码 和 一 条 DFF 语句 用 于 在 复位 后 保持 oval 信号 为 低 
电 平 ， 直 到 dirdy 信号 第 一 次 有 效 为 止 。 

图 19-16 显示 了 用 输入 字符 串 “THE” 仿 真 赫 夫 曼 编码 器 的 结果 。 用 十 六 进 制 表示 的 三 个 
符号 14 (T). 08 (H) 和 05 (E) 显示 在 信号 in 端 。 结 果 输 出 为 001 (T). 0110 (H) 和 100 
(E), M oval 信号 有 效 的 第 一 个 周期 开始 在 输出 端 out 连续 移出 。 对 于 每 个 符号 ， 计 数 器 中 的 
值 都 从 字符 串 长 度 (3 或 4) 开始 减 计 数 到 1， 移 位 寄存 器 的 值 obits 将 每 个 符号 相关 的 字符 串 
进行 左 移 。 


/HuftmanTest/clk 
/HuffmanTest/rst 
/HuftmanTest/in 
/HuffmanTesvirdy 
/HuffmanTesvout 
/HuftmanTestvoval 
he/ength 
he/count 

he/bits 

he/obits 

he/dirdy 
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图 19-16 用 字符 串 “THE” 对 赫 夫 曼 编码 器 进行 仿真 的 波形 


19.4.2 赫 夫 曼 解 码 器 


我 们 已 经 用 赫 夫 曼 编码 对 字符 串 进行 了 编码 ， 现 在 我 们 将 关注 建立 相应 的 译 码 器 。 要 对 一 
个 赫 夫 曼 编码 的 位 串 进行 译 码 ， 我 们 只 需要 简单 遍历 图 19-13 的 编码 树 ， 将 输入 位 流 的 每 一 位 
遍历 成 一 条 边 一 一 0 转换 成 左边 的 分 支 ，1 转换 成 右边 的 分 支 。 当 在 此 遍历 过 程 中 遇 到 终端 结 
点 时 ， 我 们 在 输出 端 得 出 相应 的 符号 ， 然 后 从 树 的 根部 重新 开始 遍历 。 

为 了 方便 在 一 个 表 中 存储 译 码 树 ， 我 们 对 树 的 结 点 进行 重新 标注 ， 如 图 19-17 所 示 。 每 个 结 
点 分 配 一 个 整数 作为 它 在 表 中 的 地 址 。 注 意 ， 由 于 根 结 点 不 需要 保存 在 表 中 ,我 们 将 根 结 点 的 左 
孩子 结 点 标注 为 0。 表 的 每 一 项 我 们 都 存储 一 个 类 型 和 值 。 类 型 表示 该 结 点 是 否 为 内 部 结 点 〈 类 
型 =0) 或 者 是 终端 结 点 〈 类 型 =1) 。 对 于 终端 结 点 ， 值 保存 要 得 出 的 符号 。 对 于 内 部 结 点 ， 值 
保存 该 结 点 的 左 孩 子 的 地 址 (这 个 值 总 是 偶数 )。 它 的 右 孩 子 的 地 址 可 以 通过 这 个 值 加 1 得 到 。 





wm z2qx j 
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19-17 为 了 在 译 码 表 中 方便 存储 而 重新 标注 的 图 19-13 的 赫 夫 曼 编码 树 。 树 的 每 个 结 点 分 
配 一 个 唯一 的 整数 充当 该 结 点 在 表 中 的 地 址 


为 了 看 清楚 我 们 如 何 遍 历 表示 树 的 表格 来 译 码 一 个 位 串 ， 考 虑 对 位 串 001 进行 译 码 。 我 们 
从 树 的 根 结 点 开始 ， 该 结 点 有 一 个 地 址 为 0 的 左 孩 子 ， 字 符 串 的 第 一 个 0 使 我 们 指向 这 个 孩子 
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结 点 。 我 们 读 取 地 址 为 0 的 表 项 ， 发 现 它 是 一 个 值 为 2 的 内 部 结 点 。 字 符 串 的 第 二 位 为 0， 因 
此 我 们 转 到 地 址 2 ( 如果 该 位 为 1， 我 们 应 该 转 到 地 址 3 ) 。 我 们 读 取 地 址 为 2 的 表 项 ， 发 现 它 
是 一 个 值 为 6 的 内 部 结 点 。 字 符 串 的 第 三 位 为 1， 因 此 我 们 转 到 地 址 7， 即 比 这 个 值 大 1 的 地 
址 。 读 取 地 址 为 7 的 表 项 ， 我 们 发 现 它 是 一 个 值 为 “T” (十 六 进 制 14) 的 终端 结 点 。 我 们 得 
出 这 个 值 ， 并 且 将 状态 机 进行 复位 ， 从 根 结 点 重新 开始 新 的 遍历 。 

赫 夫 曼 译 码 器 的 框图 如 图 19-18 所 示 ， 此 译 码 器 的 Verilog 程序 如 图 19-19 所 示 。 当 前 表 结 
点 的 地 址 保存 在 node 寄存 器 中 。 当 type 有 效 时 一 一 表示 终端 结 点 一 一 node 设置 为 下 一 个 输入 
位 的 值 ( 该 输入 位 选择 根 结 点 的 两 个 孩子 结 点 中 的 一 个 结 点 来 重新 开始 搜索 ) ， 表 格 的 值 字段 
启用 输出 寄存 器 ，oval 信号 在 接 下 来 的 周期 有 效 。 这 时 输出 当前 符号 ， 并 根据 下 一 个 符号 的 第 
一 位 决定 从 根 结 点 的 哪个 孩子 结 点 开始 启动 状态 机 。 如 果 type 无 效 一 一 表示 内 部 结 点 一 一 输入 
值 和 表格 的 值 字段 结合 起 来 选择 当前 结 点 的 左 孩 子 结 点 还 是 右 孩 子 结 点 一 一 对 树 进行 遍历 。 输 
人 值 提 供 结 点 地 址 的 最 低 有 效 位 ， 剩 下 的 地 址 位 由 表格 的 值 字段 提供 。 由 于 表格 中 所 有 左 孩 子 
都 是 偶 地 址 ， 因 此 这 样 简单 的 连接 操作 是 可 行 的 。 如 果 ival 信号 变 为 低 电 平 ， 状 态 机 暂停 ， 保 
持 当前 状态 ， 直 到 有 可 用 的 有 效 输入 位 。Verilog 模型 中 的 信号 ftype 强制 状态 机 在 复位 后 出 现 
第 一 个 有 效 输入 时 从 根 结 点 启动 。 
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// 苗 夫 曼 译 码 器 一 一 对 编码 器 生成 的 位 流 进行 译 码 
// in—fš, 

// ival 一 一 当 出 现 新 的 有 效 位 时 该 信号 有 效 
// out 一 一 输出 字符 

// oval 一 一 当 出 现 新 的 有 效 输出 时 该 信号 有 效 



































module HuffmanDecoder (clk, rst, in, ival, out, oval) ; 
input clk, rst, in, ival ; 
output [4:0] out ; 
output oval ; 





wire [5:0] node ; // 指向 表格 的 指针 

wire [4:0] value ; // 表格 输出 

wire type ; // 表格 类 型 

wire ftype ; // 第 一 个 ival 周 期 为 启动 泵 假设 一 个 类 型 


wire [5:0] nnode = rst ? 6’d0 
: (ival ? {(type|ftype) ? 5’bO : value, in} 
: node) ; 
wire [4:0] nout = rst ? 5’d0 


: ((ival & type) ? value : out) ; 





E 19-19 RERA] Verilog 描述 
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DFF #(6) node_reg(clk, nnode, node) ; 
HuffmanDecTable tab(node, {type, value}) ; 

DFF #(5) out_reg(clk, nout , out) ; 

DFF #(1) oval_reg(clk, “rst & type & ival, oval) ; 
DFF #(1) ft_reg(clk, rst | (ftype & ~ival), ftype) ; 





endmodule 





E 19-19 (2) 


赫 夫 曼 编 码 器 输送 给 赫 夫 曼 译 码 器 进行 联合 运行 的 波形 如 图 19-20 所 示 。 图 中 前 11 行 与 
图 19-16 相同 ， 表 示 编 码 器 对 符号 字符 串 “THE” 进行 编码 得 到 位 串 0010110100 的 操作 。 信 和 号 
mid 和 mval 是 从 编码 器 出 来 的 输出 信号 ， 同 时 是 译 码 器 的 输入 信号 (作为 in 和 ival) , PERS AE 
的 状态 显示 在 node 变量 中 ，type 和 value 变量 显示 从 表格 的 每 个 结 点 地 址 读 取 了 什么 内 容 。 注 
意 每 次 type 有 效 时 一 一 表示 叶子 结 点 一 一 在 下 一 个 周期 从 node 为 0 或 1 (取决 于 mid) 重新 开 
始 搜 索 。 同 时 在 紧 随 type 的 周期 ， 刚 完成 译 码 的 符号 在 输出 端 out 进行 输出 (用 十 六 进 制 表 
R), HHS oval 有 效 表 示 有 效 输出 。 
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图 19-20 赫 夫 曼 编码 器 和 译 码 咒 的 波形 图 ， 在 这 里 将 字符 串 “THE” 编 码 为 0010110100， 然 后 将 
此 位 流 译 码 回 到 “THE” 


小 结 

在 这 一 章 学 习 了 4 个 扩展 实例 ， 这 几 个 实例 集合 了 前 边 第 14 ~ 18 章 学 到 的 大 部 分 内 容 。3 
分 频 计 数 器 实例 加 强 了 画 状 态 图 和 用 Verilog 编程 实现 简单 FSM 的 基本 技能 。SOS 探测 器 是 通 
过 合并 公共 序列 进行 FSM 分 解 的 另 一 个 实例 。 井 字 棋 游戏 用 9.4 节 中 的 组 合 电路 ， 并 将 其 转换 
成 对 阵 自己 玩 游戏 的 FSM。 最 后 ， 赫 夫 曼 编码 器 和 译 码 器 给 出 了 数据 通路 有 限 状态 机 的 实例 ， 
它们 的 控制 完全 由 数据 状态 推断 出 来 。 


文献 说 明 
赫 夫 曼 在 参考 文献 [50] 中 介绍 了 他 的 编码 方案 。 
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习题 

19.1 4 分 频 计 数 器 。 将 19. 1 节 中 的 计数 器 修改 为 4 分 频 计 数 器 。 

19.2 9 分 频 计 数 器 。 说 明 如 何 用 两 个 3 分 频 计数 器 构成 9 分 频 计数 器 。 当 将 两 个 计数 器 结合 到 一 起 时 ， 
输出 脉冲 的 时 序 将 发 生 什么 ? 

19.3 3 分 频 米 利 状态 机 。 如 果 人 允许 输出 信号 是 当前 状态 和 输入 信和 号 的 函数 ， 说 明 如 何 只 用 三 个 状态 实 
现 19. 1 节 的 3 分 频 计 数 器 。 像 这 样 具有 从 输入 到 输出 的 组 合 路 径 的 FSM 称 为 米利 状态 机 ， 输 出 信 
号 只 是 当前 状态 的 函数 的 FSM 称 为 摩尔 状态 机 。 

19.4 改进 的 SOS 状态 机 。 修 改 19. 2 节 中 分 解 的 SOS 探测 器 ， 使 得 点 定义 为 1 个 或 2 个 连续 的 1， 破 折 
号 定义 为 3 个 或 4 个 连续 的 1。 

19.5 进一步 改进 SO0S。 进 一 步 修改 习题 19. 4 的 改进 的 SOS 状态 机 ， 使 得 在 一 个 字符 内 ， 点 和 破 折 号 之 
间 的 暂停 可 以 是 1 个 或 2 个 连续 的 0， 字 符 之 间 的 空格 是 3 个 或 4 个 连续 的 0，5 个 或 更 多 连续 的 0 
表示 字 之 间 的 空格 。SOS 出 现时 识别 为 单独 的 一 个 字 。 

19.6 HFR, Ér 19.3 节 中 的 井 字 棋 游戏 ， 使 其 包含 三 个 新 的 输出 信号 : gover (游戏 结束 ) 、 
xwin (X 获 胜 ) owin (0 获胜 )。 当 任何 一 个 比赛 者 赢得 游戏 时 ， 或 者 没有 空地 退出 时 ， 
gover 有 效 ， 停止 游 戏 ， 直 到 重新 设置 游戏 。 如 果 X (0) 是 获胜 者 ， 则 xwin (owin) 有 效 。 

19.7 并 字 棋 比赛 。 进 一 步 修改 习题 19.6 中 的 井 字 棋 游 戏 ， 使 其 包含 两 个 不 同 的 移动 发 生 器 来 代替 共享 
一 个 移动 发 生 器 ， 能 够 实现 两 者 对 阵 。 完 善 移动 发 生 器 ， 证 明 其 能 够 战胜 图 9-12 的 基准 系统 。 

19.8 井 字 棋 联赛 。 构 建 一 个 模块 ， 实 例 化 8 个 不 同 的 井 字 棋 模 块 ， 使 它们 在 单 淘汰 联赛 中 互相 对 阵 。 
每 场 比赛 最 好 有 两 个 ， 和 第 一 场 比赛 交 换 模块 。 如 果 在 比赛 结束 时 不 分 胜 负 ， 控 制 器 可 以 任意 选 
择 一 个 胜 者 。 系 统 的 输出 应 该 为 一 个 三 位 信号 champion 表示 联赛 的 获胜 者 ， 以 及 一 个 有 效 信号 
cvalid 表示 联赛 结束 。 

19.9 具有 流 控 制 功能 的 赫 夫 有 曼 编 码 器 。 修 改 19. 4. 1 节 中 的 赫 夫 曼 编码 器 ， 使 其 接受 一 个 输入 有 效 信号 
ival ， 当 输入 端 有 可 用 的 有 效 符 号 时 ， 该 信号 为 真 。 只 有 当 ival 和 irdy 都 有 效 时 ， 编 码 器 才 接受 新 
的 符号 。 注 意 ， 在 字符 串 移 出 之 后 ， 如 果 在 下 一 个 输入 信号 到 来 之 前 有 段 等 待 时 间 ， 则 输出 有 效 
信和 号 oval 需要 变 为 低 电 平 。 

19.10 更 多 的 流 控 制 。 将 习题 19. 9 中 的 赫 夫 曼 编码 器 进行 进一步 扩展 ， 使 其 接受 一 个 输出 就 绪 信 号 or- 
dy， 当 连接 到 输出 端的 模块 准备 好 接收 下 一 个 数据 位 时 ， 该 信号 为 真 。 

19.11 一 位 字符 串 。 修 改 19.4. 1 节 中 的 赫 夫 曼 编码 器 ， 使 其 工作 时 长 度 参 数 为 1， 也 就 是 说 ， 编 码 时 一 
个 符号 可 以 用 一 位 字符 串 表 示 。 

19.12 ”模式 计数 器 ，I。 设 计 一 个 时 序 逻 辑 电路 ， 具 有 一 位 输入 信号 in 、 输 出 信号 out 和 count [3 : 
0]。 当 in =0101 时 ，FSM 生成 out =1, Al) out =0。 需 要 能 够 识别 重 伙 模式， 模式 0101 的 
数量 显示 在 输出 端 count。 正 确 的 行为 如 以 下 例子 所 示 : 


in: 0010101011011101010 
out: 0000010101000000001 
count: 0000011223000000001 
m hE AH FSM 的 框图 。 


19.13 ”阵列 计数 器 ，II。 编 写 Verilog 程序 实现 习题 19. 12 中 的 阵列 计数 器 ， 并 对 其 进行 验证 。 
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Digital Design: A Systems Approach 


验证 与 测试 





验证 与 测试 在 工程 上 常 作为 设计 的 补充 。 验 证 可 以 确保 设计 符合 设计 规格 的 要 求 。 在 一 个 
典型 的 数字 系统 项 目 中 ， 投 入 验证 的 成 本 往往 高 于 设计 本 身 。 由 于 芯片 的 制造 成 本 较 高 且 周 期 
长 ， 要 想 让 芯片 首次 正常 工作 ， 充 分 的 验证 是 必 不 可 少 。 如 果 一 个 设计 上 的 错误 在 验证 阶段 没 
有 被 发 现 ， 有 可 能 会 造成 生产 延期 ， 严 重 的 甚至 有 可 能 要 更 换 生 产 设备 ， 从 而 造成 更 大 的 
损失 。 

通过 测试 ， 可 以 确保 模块 实现 其 应 有 的 功能 。 芯 片 在 制造 时 ， 由 于 某 些 原因 一 些 晶 体 管 、 
导线 或 触 点 可 能 会 出 现 故 障 。 通 过 生产 测试 ， 可 以 检测 出 这 些 故障 ， 并 依据 测试 结果 对 芯片 进 
行 修复 或 丢弃 。 


20.1 设计 验证 


仿真 是 验证 某 一 设计 是 否 符合 设计 规格 的 主要 方法 。 仿 真是 一 个 通过 向 被 测 单元 提供 大 量 
的 测试 激励 ， 并 检查 输出 波形 是 否 正确 的 过 程 。 在 本 书 中 我 们 会 多 次 使 用 Veiilog 测试 平台 进 
行 仿真 测试 。 


20.1.1 覆盖 率 的 验证 


验证 的 难点 在 于 如 何 确 保 具有 完备 的 测试 向 量 集 及 测试 套件 。 衡 量 一 个 测试 套件 的 完备 
度 ， 主 要 侧重 两 个 方面 : 需求 覆盖 率 和 代码 的 执行 覆盖 率 。 通 常 认为 ， 验 证 时 所 有 需求 功能 和 
所 有 实现 语句 及 状态 要 尽 可 能 测试 到 ， 即 覆盖 率 达 到 100% 。 

需求 覆盖 率 即 待 执行 和 检测 的 功能 在 设计 规格 中 所 占 的 比例 。 以 我 们 开发 的 一 种 数字 钟 芯 
片 为 例 ， 该 芯片 包括 日 期 和 闹钟 功能 。 表 20-1 列 出 了 部 分 待 测 试 的 功能 。 像 数字 钟 这 样 简单 
的 芯片 ， 轻 而 易 举 就 可 以 列 出 数 百 个 功能 。 对 于 一 个 复杂 的 芯片 ， 列 出 十 万 个 或 更 多 的 功能 都 
是 很 常见 的 。 每 个 测试 可 以 验证 一 个 或 多 个 功能 。 编 写 测 试 程序 时 ， 涉 及 一 个 测试 功能 就 可 以 
将 其 勾 掉 。 


表 20-1 某 数字 钟 芯片 需要 测试 的 功能 ( 仅 部 分 ) 








标 识 名 称 说 明 
I inerement 时 间 增 加 正确 
Ls ine. seconds 秒 钟 寄存 器 每 秒 增 加 1 
L sw seconds wrap 秘 钟 寄存 器 从 59 翻转 到 0 
Lm inc. minutes 秒 钟 寄存 器 从 59 翻转 到 0 时 ， 分 钟 寄 存 器 加 1 
... tt 类 似 的 还 有 L mw, L h, L hw, L days, L daysw, L months, L monthsw, L years 等 
L leap leap year EAEE, ZH BHMA 29 翻转 到 0 
A alarm [s] BP DY AE 
A. set alarm set 设置 闹钟 功能 
A. set. s alarm seconds set 设置 闹钟 的 秒 钟 
设置 闹钟 的 分 钟 和 时 钟 


A. act alarm activate 设置 闹 铃 声音 
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( 续 ) 
标 识 名 称 说 明 
A. quiet alarm deactivate X: Bs] Bh 
A. snooze alarm snooze 设置 小 睡 功能 
D display features 时 钟 状态 正确 显示 为 当前 模式 


D. time time display LCD 显示 屏 能 正确 显示 小 时 、 分 钟 和 秒 
ses sas EW. BBA BSS fie aN DHE 


将 功能 按 层次 分 开 有 利于 对 测试 进行 管理 。 例 如 ， 测 试 闹钟 功能 时 ， 将 计时 测试 和 显示 测 
试 分 开 。 这 样 就 能 够 安排 几 个 小 组 同时 对 这 些 功 进行 测试 。 

除了 检查 需求 覆盖 率 外 ， 还 要 利用 测试 套件 检查 执行 覆盖 率 。 所 选 的 测试 套件 应 该 能 够 测 
试 到 每 一 行 Verilog 代码 的 执行 情况 。 例 如 ，case 语句 的 所 有 分 支 都 应 该 被 测试 到 。 设 计 中 如 
果 有 状态 机 ， 每 个 状态 之 间 的 切换 也 都 要 遍历 到 。 

当 需 求 覆 盖 率 达到 100% 时 ， 如 果 发 现在 测试 套件 中 依然 有 部 分 Verilog 代码 没有 执行 ， 此 
时 需要 仔细 分 析 ， 判 断 这 些 语句 未 执行 的 原因 。 是 因为 该 语句 所 描述 的 功能 没有 列 在 功能 列表 
中 ， 还 是 根本 不 需要 这 些 语句 或 是 出 现 了 预料 之 外 的 错误 ， 这 都 是 需要 我 们 认真 思考 的 。 


20.1.2 测试 的 类 型 


理想 情况 下 ， 验 证 一 个 功能 可 以 采用 穷 举 测试 法 ， 也 就 是 提供 所 有 可 能 的 输入 激励 ， 并 检 
查 结果 是 否 正确 。 但 遗憾 的 是 ， 只 有 最 简单 的 模块 可 以 这 样 做 。 通 常情 况 下 尝试 所 有 可 能 的 输 
入 组 合 和 所 有 可 能 的 状态 是 不 切实 际 的 。 比 如 一 个 64 位 的 二 进 制 加 法 器 ， 输 入 向 量 有 2” = 
3.4 x10” 种 可 能 。 即 使 测试 人 员 每 秒 能 够 测试 100 万 种 向 量 ， 仍 然 需 要 10 ”年 才能 完成 测试 。 

通常 我 们 不 使 用 穷 举 测试 法 ， 而 是 将 定向 测试 和 随机 测试 结合 起 。 定 向 测试 是 选取 一 些 有 
意义 的 测试 用 例 ， 如 边界 条 件 或 极端 值 。 例 如 ， 测 试 时 钟 芯片 时 ， 检 查 时 钟 能 和 否 从 23 :59 :59 
正确 翻转 到 00 :00 :00。 测 试 加 法 器 时 ， 用 最 大 的 正 数 (MAR) 加 上 一 个 数 ， 然 后 检查 计 
算 结 果 是 否 溢出 。 

随机 测试 可 以 作为 定向 测试 的 补充 。 顾 名 思 义 ,这些 测试 是 随机 生成 的 。 对 于 加 法 器 ， 可 
以 输入 两 个 随机 操作 数 ， 然 后 检查 加 法 器 产生 的 结果 是 否 正确 。 对 于 时 钟 芯 片 ， 可 以 随机 设 定 
一 个 时 间 和 闹钟 ， 然 后 检查 时 钟 能 和 否 正 确 工 作 。 对 于 处 理 器 ， 可 以 编写 一 个 随机 指令 序列 ， 该 
指令 序列 包含 中 断 、 故 障 及 其 他 条 件 ， 然 后 检查 相关 寄存 器 是 否 处 于 正确 状态 。 

随机 测试 时 ， 均 匀 选 取 输 入 变量 会 存在 一 定 的 弊端 ， 例 如 输入 向 量 个 数 为 10 时 ， 我 们 有 
可 能 会 发 现 一 个 bug, 但 当 输 入 向 量 达到 10 ”个 时 ， 我 们 就 很 难 发 现 bug 了 。 随 机 测试 时 为 了 
便于 纠 错 ， 可 以 对 输入 空间 中 感 兴趣 的 区 域 采 取 非 均匀 采样 。 如 测试 时 钟 芯片 时 ， 我 们 可 以 在 
当前 时 间 的 几 秒 钟 内 进行 采样 ， 因 为 这 些 向 量 只 有 在 闸 钟 测试 时 才 有 意义 。 对 于 处 理 器 而 言 ， 
我 们 可 以 将 一 些 异 常 与 错误 预测 分 支 组 合 起 来 对 人 处理 器 进行 测试 ， 因 为 它们 才能 够 给 处 理 器 逻 
辑 的 工作 带 来 很 大 压力 。 

一 个 典型 测试 套件 的 测试 向 量 可 能 达到 10 个 或 更 多 。 显 然 我 们 不 能 采用 手动 方式 来 检查 
结果 是 否 正确 ， 因 为 手动 方式 需要 每 次 重新 运行 测试 程序 。 相 反 ， 我 们 需要 测试 程序 能 够 实现 
自 检 。 常 见 的 一 种 方法 是 将 我 们 的 设计 转化 成 一 个 更 高 层次 的 模型 ， 但 是 二 者 的 功能 相同 。 这 
种 高 层次 的 模型 通常 用 一 种 类 似 C 的 编程 语言 实现 ， 该 模型 不 可 能 每 个 周期 都 与 设计 完全 匹 
配 。 当 然 ， 这 个 高 级 模型 也 会 有 bug， 但 是 这 些 bug 不 大 可 能 与 Verilog 设计 中 出 现 的 完全 
一 样 。 
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20.1.3 静态 时 序 分 析 


除了 验证 设计 在 功能 上 是 否 正确 ， 还 必须 验证 它 能 否 满足 建立 和 保持 时 间 ( 见 15 22). fE 
第 15.6 节 中 我 们 已 经 讨论 过 ， 这 需要 借助 一 个 静态 时 序 分 析 仪 实现 。 该 分 析 仪 可 以 是 一 个 内 
置 的 综合 工具 ， 或 是 一 个 单独 的 程序 ， 或 者 二 者 兼备 。 

从 理论 上 讲 ， 通 过 仿真 可 以 验证 时 序 ， 但 在 实际 仿真 中 构建 一 组 最 坏 情况 下 的 时 序 测试 程 
序 是 很 难 的 。 在 静态 时 序 分 析 中 ， 不 是 所 有 路 径 都 需要 生成 测试 向 量 。 静 态 时 序 分 析 的 缺点 
是 : 一 些 永远 不 会 被 使 用 的 路 径 上 出 现 的 问题 经 常 出 现在 测试 报告 中 。 


20.1.4 形式 验证 


对 于 某 些 模块 ， 可 以 采用 一 种 无 须 仿真 就 可 以 验证 功能 的 验证 技术 。 例 如 ，Formality 工具 
在 检查 两 个 版 本 的 设计 是 否 相同 时 使 用 了 等 效 性 检查 技术 。 验 证 技术 也 常常 被 用 来 验证 协议 ， 
如 微 处 理 器 中 高 速 缓存 的 一 致 性 协议 。 验 证 技术 还 可 以 做 到 无 须 编 写 涵盖 所 有 状态 转换 的 测试 
程序 ， 就 能 验证 所 有 状态 在 转换 时 是 否 保留 了 某 些 属性 。 


20.1.5 缺陷 跟踪 


在 验证 过 程 中 ,缺陷 跟踪 系统 常用 于 跟踪 那些 已 被 测试 程序 发 现 的 缺陷 。Bugzilla 是 一 个 
开源 的 缺陷 跟踪 系统 。 

当 测 试 程序 发 现 缺 陷 时 ， 会 弹出 缺陷 报告 。 如 果 设 计 师 纠正 了 这 个 缺陷 并 对 解决 方案 做 了 
验证 ， 或 者 放弃 了 出 现 缺 陷 的 功能 ， 缺 陷 报告 将 关闭 。 在 特定 的 时 间 内 跟踪 缺陷 数量 ， 能 使 设 
计 者 在 项 目 设 计 中 保持 良好 的 状态 。 设 计 之 初 没 有 缺陷 ， 测 试 后 缺陷 数量 开始 增加 ， 当 测试 覆 
盖 率 达到 100% 时 ， 缺 陷 数 达到 最 大 值 。 随 后 缺陷 数量 会 逐渐 减少 ， 当 缺陷 报告 关闭 时 ， 我 们 
希望 不 要 再 出 现 太 多 新 的 缺陷 。 当 缺陷 数 最 终 达 到 零 时 ， 设 计 完成 ， 此 时 可 将 设计 移交 生产 部 
门生 产 。 

通过 缺陷 数量 和 时 间 之 间 的 函数 关系 ， 可 以 估算 出 缺陷 数量 达到 零 的 时 间 。 了 解 缺陷 消失 
的 时 间 分 布 也 有 助 于 我 们 把 握 调 试 过 程 。 大 多 数 缺 陷 在 一 天 内 就 可 以 快速 解决 ， 然 而 少数 有 难 
度 的 缺陷 存在 的 时 间 要 长 一 些 ， 有 时 会 达到 一 个 星期 或 更 长 的 时 间 。 


20.2 测试 


测试 过 程 是 对 设计 中 的 某 个 具体 实例 做 验证 ， 实 际 上 这 恰恰 是 在 实现 设计 。 验 证 时 ， 我 们 
希望 给 出 一 套 覆 盖 率 达到 100% 的 测试 用 例 。 但 生产 测试 的 核心 不 是 考虑 全 部 功能 是 否 实现 ， 
而 是 要 检查 设计 中 是 否 存在 潜在 的 故障 。 任 何 能 够 影响 生产 的 因素 都 必须 检查 到 。 我 们 使 用 一 
种 故障 模型 对 各 种 潜在 的 故障 进行 判断 。 

由 于 测试 时 间 成 本 较 高 ， 而 且 生 产 出 的 每 一 个 芯片 都 要 求 测试 ， 因 此 尽快 完成 测试 是 非常 
重要 的 。 因 此 ， 我 们 希望 在 最 短 的 时 间 内 对 所 有 芯片 完成 测试 。 但 总 而 言 之 ， 与 验证 本 身 相 
比 ， 验 证 时 间 并 不 是 最 重要 的 。 


20.2.1 故障 模型 


故障 模型 是 对 可 能 导致 芯片 无 法 工作 的 故障 建立 的 一 种 抽象 模型 。 在 现代 集成 电路 中 ， 任 
何 连接 (导线 和 触 点 ) 都 有 可 能 发 生 开路 或 短路 。 同 样 ， 一 个 晶体 管 也 会 因为 某 种 原因 处 于 
常 开 或 常 闭 状态 ， 从 而 无 法 正常 工作 。 

一 个 普遍 用 于 潜在 故障 模式 的 抽象 模型 称 为 固定 型 故障 模型 。 该 模型 能 够 将 可 能 导致 电路 
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电 平 固定 在 逻辑 “0” 或 逻辑 “1” 的 潜在 故障 抽象 出 来 。 

我 们 思考 一 下 图 20-1 中 的 2 输入 与 非 门 。 在 实际 生产 中 该 门 电路 可 能 会 出 现 故 障 ， 造 成 4 
个 晶体 管 MI ~ M4 中 的 一 个 或 多 个 发 生 开 路 或 短路 。 通 过 
将 门 电路 输出 固定 在 0 或 1 上 ， 我 们 可 以 建立 所 有 潜在 故 
障 的 模型 。 但 是 该 模型 不 完全 准确 。 例 如 ， 如 果 p 型 场 效 
应 晶体 管 (PFET) M1 开路 ， 该 门 不 能 正常 工作 ， 但 输出 
不 会 固定 在 一 种 状态 上 。 当 b=0 时 ， 输 出 仍然 为 高 电 平 ; 
X a=b=1 时 ,输出 为 低 电 平 。 因 此 ， 当 测试 发 现 输 出 为 
固定 0 故障 时 ， 可 能 检测 不 到 ML 开路 。 尽 管 存在 这 个 缺 
点 ， 固 定型 故障 模型 依然 具有 和 良好 的 覆盖 率 ， 它 能 够 为 我 





们 检查 出 实际 生产 中 的 各 种 制造 故障 。 图 20-1 2 输入 与 非 门 。 采 用 固定 故 

障 模型 ， 该 门 所 有 潜在 的 

20.2.2 组 合 逻 辑 测试 物理 故障 均 建 立 在 9 输出 
为 了 测试 一 个 组 合 逻辑 块 ， 我 们 需要 一 组 测试 向 量 ana 


来 检测 逻辑 块 内 所 有 节点 的 电 平 ， 看 其 是 否 固定 在 0 或 1 上 。 这 里 以 图 20-2 中 的 全 加 器 为 
例 (与 图 10-5 一 致 ) 。 固 定型 故障 模型 检测 出 该 电路 可 能 有 10 PP ABS og’. p's s. count 或 
Q3 的 输出 电 平 可 能 始终 为 0 或 1。 为 检测 某 一 特定 故障 ， 需 要 将 检测 节点 的 逻辑 电 平 置 为 
相反 状态 ， 输 出 对 该 节点 敏感 。 如 表 20-2 所 示 ， 用 两 组 测试 向 量 (一 组 全 1 和 一 组 全 0 ) 
就 可 以 覆盖 该 电路 中 的 全 部 10 个 固定 型 故障 ( 电 平 固定 在 0, 标记 为 信号 -0; 固定 在 1, 
标记 为 信号 -1)。 





图 20-2 ”一 个 全 加 法 器 的 CMOS 门 级 实现 


表 20-2 两 个 测试 向 量 足以 覆盖 图 20-2 中 全 加 器 的 固定 型 故障 





a b cin g' p' Q3 cout s 故障 覆盖 
0 0 0 l 1 1 0 0 g'-0, p'-O, cout-1, sout-1, Q3-0 
l I l 0 l 0 l l g'-1, p'-1, cout-0, sout-0, Q3-1 


测试 向 量 自动 生成 工具 (ATPG) 能 够 自动 为 组 合 逻辑 产生 测试 向 量 。 只 要 给 出 一 个 网 表 ， 
ATPG 工具 将 生成 一 个 最 小 的 测试 向 量 集 ， 如 果 可 能 ， 能 达到 100% 的 故障 覆盖 率 。 


20.2.3 METRE 


有 些 逻 辑 电 路 会 包含 一 些 元 余 的 门 ， 例如， 在 异步 逻辑 或 其 他 一 些 存在 潜在 风险 的 电路 中 
经 常会 出 现 匈 余 门 。 要 想 达 到 100% 的 故障 覆盖 率 ， 必 须 添 加 额外 的 信号 来 禁用 元 余 电路 。 


= 之 所 以 这 么 叫 是 因为 它们 是 用 于 测试 的 位 向 量 


| 
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例如 ， 我 们 分 析 图 20-3 中 的 2 输入 多 路 选择 器 (与 图 6-19b 一 致 ) ， 该 电路 出 现 故障 的 风 
险 小 。 在 门 Q3 的 输出 端 不 可 能 测试 到 电 平 为 0 的 固定 型 故障 。 任 何 时 间 只 要 a = b=1, Q2 或 
Q4 的 输出 肯定 会 有 一 个 为 高 ， 无 论 Q3 为 何 值 ， 输 出 了 始终 为 高 。 

为 了 测试 该 电路 ， 必 须 在 其 他 两 个 门 中 的 任何 一 个 门 上 添加 一 个 辅助 输入 信号 。 图 20-4 
中 增加 了 一 个 辅助 信号 test， 该 信号 与 Q2 相连 。 在 正常 工作 时 test =1， 多 路 选择 器 像 以 前 一 
样 工 作 。 测 试 时 ， 人 允许 tet 在 0 和 1 中 取 值 。 有 了 这 个 输入 信号 后 ， 当 向 量 a=1, b=1, c=1, 
test =0 时 ， 可 以 检测 到 Q3 输出 为 固定 0 故障 。 





图 20-3 无 故障 风险 的 2 输入 多 路 选择 器 图 20-4 在 图 20-3 电路 中 Q2 的 栅 极 添 


(与 图 6-19b 一 致 ) 有 一 个 元 余 门 加 一 个 测试 输入 ， 使 该 电路 具 
Q3 ， 该 电路 不 可 测试 备 可 测 性 
20.2.4 扫描 


通过 使 用 扫描 链 ， 可 以 将 时 序 逻 辑 测试 简化 为 组 合 逻辑 测试 。 图 20-5 在 设计 中 就 采用 了 
扫描 链 ， 每 个 触发 器 的 输入 都 与 多 路 选择 器 相连 。 当 多 路 选择 器 的 选择 端 处 于 扫描 状态 时 ， 触 
发 器 与 移 位 寄存 器 相连 。 

为 了 把 一 个 测试 向 量 送 入 芯片 内 的 每 个 组 合 逻 辑 块 ， 芯 片 应 处 于 扫描 模式 ， 测 试 向 量 就 可 
以 移 人 移 位 寄存 器 中 。 随 后 将 scan 输入 
端 置 为 低 ， 在 一 个 时 钟 周 期 内 对 所 有 逮 
辑 块 的 输出 进行 采样 并 打 和 触发 器 。 最 
后 , 再 次 扫描 ,将 测试 结果 移出 后 检 
查 。 测 试 结 果 移 出 的 同时 ， 一 个 新 的 向 
量 又 被 移入 。 

为 了 对 时 序 逻 辑 进 行 完整 的 扫描 测 
试 ， 所 有 组 合 逻 辑 的 输入 和 输出 都 必须 
通过 扫描 链 来 访问 。 这 意味 着 , 像 0、 
SRAM 这 些 宏 单 元 的 输入 和 输出 部 分 都 
要 有 扫描 寄存 器 。 

扫描 技术 也 可 用 于 测试 已 焊接 好 芯 
片 的 印刷 电路 板 。 将 芯片 的 输入 和 输出 
连接 到 一 个 扫描 链 上 ， 通 过 移动 测试 向 
量 来 测试 电路 板 上 芯片 之 间 的 连接 。 由 图 20-5 为 每 个 触发 器 添加 一 个 多 路 选择 器 ， 当 scan 信 
于 输入 和 输出 可 以 看 作 芯 片 的 边界 ， 因 号 发 出 时 ， 芯片 内 的 所 有 触发 器 连接 到 扫描 链 
此 这 个 技术 通常 被 称 为 边界 扫描 测试 的 移 位 寄存 器 上 。 通 过 扫描 链 ， 可 以 将 测试 向 
技术 。 量 移入 并 将 测试 结果 移出 
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集成 电路 扫描 测试 中 普遍 使 用 的 接口 是 IEEE 的 JTAG 接口 [54]. 


20.2.5 内 置 自 测试 


对 片上 存储 器 RAM 和 ROM ( 见 第 8.8 节 和 第 8. 9 节 ) 进行 全 面 测试 通常 需要 很 多 测试 向 
量 。 对 于 RAM， 每 一 位 都 必须 写 人 “1” 和 “0”， 然 后 再 进行 回 读 。 为 了 检查 寻 址 故障 ， 输 入 
的 地 址 测试 向 量 必须 有 很 大 的 变化 ， 这 样 做 的 目的 是 避免 出 现 将 地 址 a 中 读 取 的 数 误 认 为 是 从 
地 址 b 中 读 取 的 。 这 种 测试 可 以 通过 扫描 链 来 完成 , 但 是 会 花费 大 量 的 时 间 ， 增 大 了 测试 
成 本 。 

为 了 缩短 片上 存储 器 的 测试 时 间 ， 目 前 芯片 内 大 多 采用 了 内 置 自 测试 (BIST) 方式 。BIST 
电路 是 一 个 与 存储 器 或 存储 器 组 有 关 的 状态 机 ， 它 可 以 生成 测试 向 量 并 进行 测试 。 执 行 一 次 向 
EWR, 扫描 链 需要 少 则 数 千 ， 多 则 数 百 万 个 周期 ， 而 BIST 电路 可 以 每 个 时 钟 周 期 执行 一 次 
向 量 测试 ， 其 测试 RAM 的 速度 与 扫描 链 长 度 成 正比 。 

典型 的 BIST 电路 是 一 个 具有 简单 数据 通路 的 有 限 状 态 机 ， 如 图 20-6 所 示 。 正 常 工作 时 ， 
所 有 多 路 选择 器 选择 上 面 的 通路 作为 输入 ， 此 时 RAM 正常 工作 。 当 BIST 控制 器 的 输入 信号 
start AY, BIST 控制 器 选择 下 面 的 通路 作为 多 路 选择 器 输入 ， 并 开始 接收 测试 向 量 。 地 址 发 
生 器 按 序 产 生 内 存 地 址 。 向 量 发 生 器 选取 预定 义 的 向 量 并 写 人 存储 器 ， 例 如 01010101 和 
10101010。 比 较 器 用 来 检测 从 存储 器 中 读 取 的 数据 。 当 测试 完成 时 ， 控 制 器 发 出 done 信号 。 
输出 信号 pass 用 来 指示 测试 是 否 通过 ， 此 时 多 路 选择 器 的 输入 切 回 到 上 面 的 通路 。 习 题 20. 13 
会 对 这 个 状态 机 的 操作 细节 进行 讨论 。 


Addr 





图 20-6 RAM 中 的 内 置 自 测试 电路 


有 些 BIST 电路 还 在 这 个 基础 上 做 了 一 些 改进 ， 改 进 后 该 电路 能 够 修复 测试 过 程 中 发 现 的 
错误 。 通 过 预 留 一 些 备用 的 行 或 列 ， 使 RAM 变 得 可 修复 。BIST 电路 将 备用 的 行 或 列 地 址 写 入 
一 个 寄存 器 。 内 存 修 复 细节 将 在 习题 20. 14 中 探讨 。 

另 一 类 BIST 逻辑 电路 用 于 伪 随机 测试 。 片 上 的 LBIST 状态 机 生成 一 系列 的 测试 向 量 ， 这 
些 测试 向 量 经 扫描 送 入 寄存 器 ， 在 时 钟 控制 下 又 被 扫描 到 片上 的 一 个 多 输入 签名 寄存 器 中 
(MISR). MISR 通过 一 系列 的 移 位 和 蜡 或 操作 ， 将 芯片 内 所 有 的 状态 减少 为 几 个 64 位 的 字 。 
这 个 过 程 需要 重复 多 次 ， 最 后 将 MISR 中 的 数据 扫描 到 片 外 ， 与 期 望 值 进行 比较 。 由 于 有 限 状 
态 机 全 部 位 于 片 内 ， 与 传统 的 扫描 方式 相 比 ，LBIST 可 以 运行 更 多 的 测试 用 例 。 
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20.2.6 特性 测试 


特性 测试 是 在 设计 样品 上 进行 的 ， 目 的 是 确定 该 设计 的 典型 参数 、 极 端 参 数 及 工作 包 络 
线 ， 并 且 还 要 测试 器 件 的 老化 性 能 。 生 产 测试 是 对 生产 出 的 全 部 芯片 进行 测试 ， 而 特性 测试 仅 
抽取 少量 芯片 样本 进行 测试 。 

通过 特性 测试 ， 我 们 可 以 得 到 芯片 输入 和 输出 的 电气 参数 ， 以 及 芯片 在 不 同 工 作 模 式 下 的 
功 耗 。 输 入 和 输出 电路 的 特征 可 以 由 几 个 工作 点 测 得 ， 例 如 特定 负载 下 的 Vo 和 Vo,， 或 测 得 一 
PERR V-I 曲线。 

芯片 的 工作 包 络 线 是 指 芯片 正常 工作 时 电源 电压 fp 和 时 钟 频 率 a 所 在 范围 。 在 Vo M Sa 
的 各 种 组 合 下 对 某 一 芯片 做 功能 测试 ， 然 后 将 通过 测试 的 组 合 记 录 下 来 就 可 以 绘制 出 该 芯片 的 
包 络 线 。 例 如 ， 图 20-7 就 是 某 芯 片 的 工作 包 络 线 ， 由 于 该 图 很 像 shmoo 的 卡通 形象 ， 通 常 把 它 
称 为 shmoo 图 。 


Vor(V) 
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Fe] 20-7 用 shmoo 图 表示 某 必 片 正常 工作 时 的 Von Al fak 


从 图 20-7 中 可 以 看 出 ， 该 芯片 允许 工作 的 最 低 电 压 Vu, 90.6 Vo BEX Vutt, THES 
[443] XX 800 MHz。 随 着 电压 增 大 ， 工 作 频 率 增高 ， 电 压 1.2 V 时 频率 达到 最 高 1.6 GHz, 
特性 测试 还 包括 加 速 寿 命 测试 ， 该 测试 用 来 测量 器 件 的 失效 率 ， 有 时 也 被 称 为 老化 测试 。 
老化 测试 通常 选择 在 高 温 下 (100°C 以 上 ) 进行 ， 器 件 按照 阿 伦 尼 乌 斯 方程 中 定义 的 规律 加 速 
老化 。 老 化 测试 时 ， 选 择 充 足 的 样品 ， 并 使 样品 长 时 间 工 作 于 高 温 环境 下 ， 就 可 以 从 统计 学 上 
对 失效 率 做 显著 性 检验 ， 或 者 至 少 保证 失效 率 在 可 接受 范围 内 具备 一 定 的 可 信和 度 。 


小 结 

本 章 中 我 们 学 习 了 验证 和 测试 的 基本 知识 。 设 计 验 证 可 以 确保 设计 符合 设计 规格 。 我 们 在 
编写 验证 测试 时 要 具备 完整 的 需求 覆盖 率 ， 以 确保 所 有 设计 功能 能 够 正确 实现 。 此 外 还 要 具备 
完整 的 执行 覆盖 率 ， 以 确保 每 一 行 Verilog 代码 都 能 够 被 执行 。 我 们 可 以 通过 跟踪 缺陷 数量 来 
管理 验证 过 程 ， 还 可 以 估算 验证 完成 的 时 间 。 
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测试 能 够 检测 到 某 一 器 件 的 制造 工艺 是 否 存在 问题 。 我 们 使 用 故障 模型 来 衡量 一 个 测试 的 
覆盖 率 ， 通 常 使 用 的 模型 为 固定 型 故障 模型 。 为 了 能 可 靠 地 检测 出 芯片 故障 ， 固 定型 故障 覆盖 
率 应 该 达到 100% 。 要 实现 这 个 指标 ， 可 能 需要 增加 一 些 元 余 的 信号 逻辑 。 

同步 数字 系统 的 测试 过 程 是 高 度 自动 化 的 。 测 试 向 量 自动 生成 工具 ( ATPG) 能 够 自动 为 
组 合 逻 辑 电路 生成 测试 向 量 。 将 触发 器 连接 到 扫描 链 上 就 可 以 按照 组 合 逻辑 电路 的 方式 对 时 序 
逻辑 进行 测试 。 

通过 对 样品 做 特性 测试 ， 可 以 确定 某 一 芯片 的 工作 包 络 线 、 关 键 参 数 和 失效 率 。 利 用 
shmoo 图 可 以 将 Vip、fi 的 工作 包 络 线 可 视 化 。 高 温 下 的 加 速 寿命 测试 可 以 用 来 估算 失效 率 。 


文献 说 明 


阅读 参考 文献 [9] 可 以 获得 有 关 处 理 器 Intel Pentium 48@ 验 证 的 更 多 过 程 。 文 献 中 给 出 了 
引起 故障 的 一 些 因素 ， 排 在 前 两 项 的 分 别 是 “低级 错误 ”和 “理解 错误 ”。 

参阅 文献 [58] 和 [111] ， 了 解 更 多 有 关 测 试 向 量 生成 的 内 容 。 很 多 生成 算法 基于 故障 
等 价 的 思想 [70]。 

最 早 的 扫描 锁 存 器 是 IBM 的 LSSD 锁 存 器 [39], 文献 [8] 介绍 了 它 在 系统 中 是 如 何 使 
用 的 。 

文献 [11] 和 [62] 介绍 了 内 存 中 的 BIST 和 修复 。 正 如 McCluskey 在 文献 [69] 中 所 述 ， 
BIST 还 可 以 用 来 测试 逻辑 。Riley 等 人 在 文献 [93] 中 详细 介绍 了 IBM Cell8 处 理 器 使 用 的 测试 
策略 。 

shmoo 是 20 世纪 70 年 代 由 休斯顿 发 明 的 ， 如 果 想 进一步 了 解 可 以 查阅 文献 [ 6 ] 。 如 果 
读者 更 喜欢 阅读 漫画 书 而 不 是 学 术 论 文 , 文献 [23] 就 是 一 个 不 错 的 选择 。 

若 想 了 解 加 速 寿命 测试 背后 的 相关 数学 知识 ， 可 以 查阅 文献 [84]. 


20.1 功能 列表 ，I。 列 出 一 个 简单 的 四 功能 计算 器 芯片 的 功能 表 。 该 芯片 的 输入 端 与 一 个 小 键盘 相连 ， 
输出 显示 采用 一 个 四 位 的 七 段 数 码 管 。 

20.2 功能 列表 ，I。 写 出 一 个 电子 表 芯 片 的 功能 列表 。 

20.3 功能 列表 ，II。 列 出 图 17-10 中 交通 灯 控 制 器 的 功能 列表 。 

20.4 功能 列表 ，IV。 列 出 图 16-21 中 自动 售卖 机 的 功能 列表 。 

20.5 定向 测试 。 用 Verilog 编写 一 个 32 位 补 码 加 法 器 的 测试 程序 ， 并 指定 6 个 测试 向 量 。 解 释 选择 这 几 
个 测试 向 量 的 原因 。 

20.6 随机 测试 。 用 Verilog 编写 一 个 32 位 加 法 器 的 测试 程序 ， 随 机 选取 100 个 测试 向 量 。 

20.7 执行 覆盖 率 。 编写 图 17-11 中 交通 灯 控 制 器 的 测试 平台 ， 要 求 状态 图 中 所 有 状态 的 都 能 被 测试 到 。 

20.8 组 合 测试 ，I。 给 出 图 8-3 中 译 码 器 的 最 小 测试 向 量 集 ， 使 覆盖 率 达到 100% 。 

20.9 组 合 测 试 ，I。 给 出 图 8-10a 中 多 路 选择 器 的 最 小 测试 向 量 集 ， 使 覆盖 率 达到 100% 。 

20.10 故障 模型 ，I。 考 虑 门 电 路 输入 端 出 现 的 固定 型 故障 ， 例 如 ， 图 10-5 全 加 器 中 的 QS 底部 输入 与 
另外 两 个 输入 信号 不 同 ， 它 是 由 信号 pow, WHS ee 1 故障 。 由 于 该 图 中 有 13 个 门 
输入 ， 因 此 可 能 会 出 现 26 种 故障 。 写 一 个 测试 向 量 集 ， 涵 盖 与 Q5 有 关 的 6 个 故障 。 

20.11 ÈRA, H. 修改 习题 20. 10 中 的 测试 向 量 集 ， 要 求 能 涵盖 与 Q3 有 关 的 4 个 故障 。 

20.12 故障 模型 ，II。 修 改 习题 20. 10 中 的 测试 向 量 集 ， 要 求 能 涵盖 与 Q4 有 关 的 6 个 故障 。 

20.13 内 置 自 测 试 。 用 Verilog 编写 与 图 20-6 中 BIST 单元 类 似 的 模型 ， 用 该 模型 测试 一 个 容量 为 8 KB 
的 RAM。 该 BIST 单元 执行 以 下 测试 。 

(a) 在 RAM 每 一 个 地 址 单元 内 写 人 二 进 制 数 01010101。 
(b) fEBbjhk i A 10101010， 即 M[i] =10101010。 验 证 M[i] =10101010 和 M[j] =01010101, 
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Vij. 
(c) 在 地 址 i 中 写 入 01010101, BB M [i] =01010101, 
(dd) 将 该 值 求 补 后 重复 (a) ~ (c). 
(e) 发 出 done 信号 ， 如 果 成 功 再 发 出 pass 信号 。 
存储 器 修复 。 用 Verilog 编写 存储 器 模型 ， 该 存储 器 是 一 个 8 KB 的 RAM 阵列 ， 并 具有 一 个 8 位 
的 备用 寄存 器 。 使 用 一 个 宽度 为 13 位 的 寄存 器 存放 被 替换 字 节 的 地 址 ， 同 时 设置 一 个 附加 位 指 
示 是 否 发 生 了 替换 。 当 替换 指示 被 置 位 ， 按 地 址 寄存 器 中 的 地 址 进行 读 取 和 写 人 时 ， 应 访问 8 位 
数据 寄存 器 ， 而 不 是 RAM 阵列 。 
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系统 级 设计 


阅读 到 本 章 时 ， 读 者 应 该 已 经 具备 设计 复杂 组 合 逻辑 和 时 序 逻 辑 电路 的 能 力 了 。 当 有 人 请 
你 设计 一 个 DVD 播放 器 、 计 算 机 系统 或 上 网 用 的 路 由 器 时 ， 你 应 该 会 意识 到 这 些 系统 内 部 不 
应 只 包含 一 个 有 限 状 态 机 ( 简称 FSM) ， 甚 至 连 有 限 状 态 控制 器 相关 联 的 数据 通道 都 不 止 一 个 。 
一 个 典型 的 系统 通常 由 多 个 模块 组 成 ， 而 且 每 一 个 模块 包含 多 个 数据 通路 和 有 限 状 态 控制 器 。 
在 运用 之 前 学 到 的 设计 和 分 析 方 法 前 ， 首 先 必须 把 这 些 系 统 分 解 成 若干 个 简单 的 模块 。 但 是 ， 
如 何 划 分 系统 使 设计 变 得 易于 管理 并 不 是 一 件 容易 的 事 。 系 统 级 设计 是 数字 系统 中 一 项 有 趣 和 
最 富有 挑战 性 的 工作 。 


21.1 系统 设计 过 程 

系统 设计 包括 以 下 几 步 : 

规格 : 设计 一 个 系统 最 重要 的 步骤 是 确定 你 将 要 做 什么 ， 并 用 书面 的 形式 把 它 明确 地 描述 
出 来 。 有 关 规 格 的 细节 我 们 将 在 21.2 节 中 讨论 。 

划分 模块 :系统 的 需求 一 旦 确定 ,系统 设计 的 主要 工作 是 把 系统 划分 为 易 管理 的 子 系统 或 
模块 。 这 里 可 以 采用 一 种 分 而 治之 的 方法 ， 将 整个 系统 划分 成 子 系统 ， 然 后 再 对 每 个 子 系统 进 
行 单独 设计 。 在 设计 子 系统 的 每 个 阶段 ， 对 子 系统 细节 的 描述 应 该 和 第 一 步 中 对 系统 总 体 的 描 
述 水 平 保持 一 致 。21. 3 节 将 介绍 三 种 划分 系统 的 方式 : 状态 、 任 务 或 接口 。 

接口 规范 : 对 各 个 子 系统 之 间 的 接口 进行 详细 描述 是 非常 重要 的 。 只 有 具备 良好 的 接口 规 
范 ， 才 可 以 独立 地 开发 和 验证 每 一 个 模块 。 设 计时 尽 可 能 将 接口 与 模块 独立 开 ， 这 样 修改 模块 
时 不 会 影响 接口 或 相 邻 模块 的 设计 。 

时 序 设计 : 在 系统 设计 早期 ， 对 操作 的 时 间 和 顺序 进行 描述 是 很 重要 的 。 尤 其 是 当 工 作 流 
涉及 多 个 模块 时 ， 必 须 将 各 个 模块 执行 任务 的 时 序 制定 出 来 ， 这 样 才能 保证 在 正确 的 时 间 和 地 
点 出 现 正确 的 数 。 时 序 设计 对 于 下 文中 提 到 的 性 能 优化 也 是 很 重要 的 。 

模块 设计 : 一 旦 划分 完 系统 ,模块 和 接口 就 已 经 确定 ,系统 的 时 序 也 就 制定 出 来 了 ， 各 个 
模块 就 可 以 单独 进行 设计 和 验证 了 。 在 模块 设计 完成 前 ,通常 我 们 还 无 法 准确 获得 模块 的 性 能 
和 时 序 ( 例 如 吞吐 率 、 延 迟 或 流水 线 深度 ) 。 当 这 些 性 能 参数 确定 下 来 后 ， 这 些 参数 有 可 能 会 
影响 系统 的 时 序 ， 此 时 为 满足 系统 性 能 指标 还 要 进行 进一步 优化 。 衡 量 一 个 系统 设计 的 好 坏 ， 
可 以 看 这 些 独 立 设计 的 模块 是 否 不 需要 修改 就 可 装 人 系统 正常 工作 。 

性 能 优化 : 一 旦 知道 或 至 少 能 估算 出 各 个 模块 的 性 能 参数 时 ， 我 们 就 可 以 分 析 系 统 并 确定 
它 是 否 符合 性 能 指标 。 如 果 性 能 指标 达 不 到 要 求 ， 或 者 无 法 实现 最 高 的 性 价 比 ， 这 时 可 以 通过 
增加 并 行 性 来 优化 系统 性 能 。 第 23 章 中 我 们 将 详细 讨论 这 方面 的 问题 。 


21.2 规格 

很 多 人 在 开始 设计 一 个 系统 时 没有 制定 明确 的 规格 ， 当 设计 进行 到 一 半 ( 或 多 半 ) 时 才 发 
现 他 们 构建 的 系统 是 错误 的 。 此 时 需要 对 系统 进行 重新 设计 ,之 前 已 做 的 大 量 工作 不 得 不 丢 
奔 。 当 规格 表述 不 清 时 会 出 现 另 一 个 问题 ， 即 设计 师 对 规格 的 理解 产生 歧义 ， 设 计 出 来 的 系统 
部 件 不 兼容 。 
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系统 设计 之 初 可 以 先 对 需求 进行 口头 讨论 。 但 最 关键 的 还 是 撰写 ， 这 一 环节 能 决定 设计 时 是 
否 会 产生 睹 义 。 规 格 写 好 后 还 可 以 让 潜在 的 客户 和 系统 用 户 审阅 ， 以 验证 系统 设计 是 否 正确 。 

一 个 恨 好 的 规格 至 少 必 须 包 括 以 下 描述 。 

1) 系 统 整 体 描述 : 系统 是 什么 、 能 做 什么 以 及 如 何 使 用 。 

2) 所 有 的 输入 和 输出 的 格式 、 取 值 范围 、 时 序 及 协议 。 

3) 所 有 用 户 可 见 的 状态 ， 包 括 配置 寄存 器 、 模 式 位 数 及 内 部 存储 器 。 

4) 所 有 工作 模式 。 

5 ) 系统 的 所 有 亮点 。 

6) 所 有 有 意义 的 边界 情况 ， 即 系统 如 何人 处 理 边界 情况 。 

下 面 以 Pong 游戏 、DES 破解 器 和 音乐 播放 顺 为 例 ， 分 别 给 出 这 三 个 系统 的 规格 。 


21.2.1 Pong 


整体 描述 : Pong 是 Atari 公司 在 20 世纪 70 年 代 早期 开发 的 一 款 视频 游戏 。 它 是 显示 在 
VGA 视屏 上 的 一 个 类 似 打 乒 乓 球 的 游戏 。 用 户 通过 按键 移动 球拍 和 发 球 来 控制 游戏 。 游 戏 规 
则 为 11 分 制 ， 获 胜 方 发 球 。 游 戏 中 的 屏幕 被 设计 成 ca 
64 x 64 的 格子 ， 其 中 左上 角 为 (0, 0)。 图 21-1 为 游 | 
戏 的 屏幕 截图 。 

输入 和 输出 表 21-1 对 系统 的 输入 和 输出 做 了 
规定 。 请 注意 ， 数 字模 块 输出 的 红 、 绿 、 蓝 和 同步 信 
号 用 于 显示 。 这 些 信号 与 一 个 模拟 模块 结合 后 产生 的 
模拟 信号 驱动 显示 器 显示 。 

状态 ， 系统 的 可 见 状 态 如 表 21-2 所 示 。 这 些 状 
态 大 多 表示 游戏 中 各 元 素 在 视屏 上 的 位 置 。 这 里 的 可 
见 状态 是 指 在 显示 器 上 能 够 看 到 。 用 户 不 能 直接 读 写 
这 些 状态 。 

模式 : 系统 的 工作 模式 如 表 21-3 所 示 。 

虽然 我 们 已 经 给 出 了 Pong 视频 游戏 的 很 多 细节 ， 
但 该 规格 并 不 完整 。 很 多 细节 并 没有 确定 ， 如 发 球 时 ”图 21-1 Pong 游戏 界面 。 该 系统 将 两 个 
球 的 位 置 和 速度 ， 击 球 时 y 方 向 的 速度 如 何 变化 ， 球 ee WO al 
拍 的 高 度 。 一 个 完整 的 规格 不 应 该 为 设计 者 留 下 任何 ae ee 
想象 空间 。 在 习题 21. 1 中 要 求 读者 写 出 Pong 游戏 完整 的 规格 。 在 实际 设计 中 ,规格 通常 以 先 
代 的 方式 进行 ， 每 次 类 代 会 增加 一 些 细节 。 撰 写 完成 后 通常 会 提交 给 一 个 小 组 进行 严格 的 审 
查 ， 以 便 找 出 遗漏 的 或 不 正确 的 事项 。 


表 21-1 Pong 游戏 系统 的 输入 和 输出 

























































































































































































































































































































































































名 称 方 向 宽 度 # R 
leftUp 输入 1 为 真 时 ， 左 边 球拍 向 上 移动 
leftDown 输入 l 为 真 时 ， 左 边 球 拍 向 下 移动 
leftStart 输入 l | 为 真 时 ， 开 始 游戏 或 从 左 向 右 发 球 
rightUp 输入 I 为 真 时 ， 右 边 球 拍 向 上 移动 
rightDown 输入 1 为 真 时 ， 右 边 球拍 向 下 移动 
rightStart 输入 1 为 真 时 ， 开 始 游戏 或 从 右 向 左 发 球 
red 输出 8 屏幕 上 当前 像素 中 红色 的 强度 
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( 续 ) 
名 称 描 R 
green 屏幕 上 当前 像素 中 绿色 的 强度 
blue 屏幕 上 当前 像素 中 蓝 色 的 强度 
hsync 水 平 同 步 ， 有 效 时 在 屏幕 上 进行 水 平 回 扫 
vsync 垂直 同步 ， 有 效 时 在 屏幕 上 进行 垂直 回 扫 








表 21-2 Pong 游戏 系统 中 用 户 的 可 见 状态 
# g 




















































rightPadY 6 右边 球拍 顶部 在 y 轴 上 的 位 置 
leftPadY 6 左边 球拍 顶部 在 y 轴 上 的 位 置 
ballPosX 6 ERZE x 轴 上 的 位 置 
ballPosY 6 球 在 y 轴 上 的 位 置 
ballVelX 1 球 在 * 方 向 上 的 运动 (0 WA, 1 为 右 ) 
ballVelY 2 球 在 y 方 向 上 的 运动 (00 为 不 动 ，01 为 上 ，10 为 下 ) 
rightScore 4 右边 玩家 的 分 数 
lefiScore 左边 玩家 的 分 数 
M: idle, merve, lserve, play 


# 21-3 Pong 系统 的 工作 模式 
He j 

分 数 为 零 ， 等 待 第 一 次 发 球 : 先 按 下 开始 按钮 ， 分 数 为 0。 游 戏 开 始 后 ， 从 某 个 方向 发 球 ( 例 
On, Istart 表示 从 左 向 右 发 球 ) 

球 的 轨迹 : 根据 球速 前 进 ; 到 达 顶 部 或 底部 后 以 y 方 向 速度 反弹 ; 碰 到 球拍 后 以 x 方向 速度 
反弹 ; 左边 或 右边 丢 球 后 分 别 进入 rserve 或 Iserve 模式 ， 同 时 修改 分 数 

等 待 左边 玩家 发 球 ， 当 lstart 按 下 ， 从 左 到 右 发 球 

等 待 右 边 玩家 发 球 ， 当 rstart 按 下 ， 从 右 到 左 发 球 


名 称 





idle 


play 





lserve 





rserve 





21.2.2 DES 破解 器 : 


整体 描述 : DES 破解 器 接收 用 数据 加 密 标 准 加密 的 密 文 ， 在 可 能 的 密 钥 空间 搜索 并 找到 密 
文 的 加 密 密 钥 。DES 是 对 称 密 钥 算法 ,数据 加 密 和 解密 使 用 的 是 相同 的 密 钥 。 找 到 密 钥 后 ， 用 
户 就 可 以 读 取 和 发 送 加 密 文 本 了 。 如 果 想 检查 系统 给 出 的 密 钥 是 否 正确 ， 可 以 检查 输出 是 否 为 
明文 。 我 们 假设 原始 明文 是 只 包含 大 写字 母 和 数字 的 ASCI 文本 。 

DES 标准 可 以 对 8 字 节 的 文本 块 加 密 ， 但 不 能 对 整个 文本 进行 加 密 。 因 此 ， 通 过 一 个 密 
钥 ，DES 破解 器 以 8 字 节 为 单位 对 密 文 进行 迭代 处 理 ， 并 检查 每 个 明文 。 如 果 一 个 密 钥 能 够 将 
所 有 文本 块 译 码 为 明文 ， 则 破解 成 功 。 

输入 和 输出 : DES 破解 器 的 输入 和 输出 如 表 21-4 所 示 。 当 用 户 将 一 块 密 文 送 到 cipherText 
时 ，cipherTextValid 信号 有 效 。 当 接收 到 所 有 密 文 后 ， 发 出 start 信号 ，DES 系统 开始 进行 解密 。 
本 节 中 ， 我 们 假设 所 有 数据 都 存 人 RAM。 习 题 21. 2 中 要 求 读 者 自己 定义 一 个 输入 协议 。 

读 和 全 部 密 文 后 ， 用 户 发 出 start 信号 。DES 破解 器 开始 运行 直到 解密 完成 。 当 某 个 密 钥 成 
功 将 密 文 解密 为 明文 时 ， 发 出 found 信号 ，key 端口 输出 该 密 钥 。 
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状态 : DES 破解 器 的 各 个 可 见 状 态 如 表 21-5 所 示 。 每 次 解密 时 设置 一 个 key 值 ， 当 解密 成 
功 时 该 值 将 保持 不 变 。blockNumber 状态 用 来 选择 待 解 密 的 cipherTextBlock。mode 用 来 指示 系 
统 所 处 的 状态 : 正在 读 取 新 数据 、 执 行 解密 还 是 处 于 空闲 状态 。 

模式 : DES 破解 器 的 工作 模式 如 表 21-6 所 示 。 系 统 包括 3 种 工作 模式 : idle、datam、 
cracking, 


以 上 DES 破解 器 的 规格 所 列 功能 有 限 。 在 习题 中 ， 要 求 读 者 对 其 进行 扩展 ， 扩 展 后 该 系 














方向 宽度 ij 述 
输入 
cipherTextValid 输入 
cipherTextReady 输出 
输入 开始 密 钥 搜索 : 当 全 部 密 文 装 人 后 ， 通 知 系统 开始 搜索 密 钥 空 间 


待 破解 密 文 : 一 次 输入 一 字 节 ; 当 cipherTextValid 和 cipherTextReady 
4 
start 
found 输出 
key 输出 56 当 found 信号 有 效 后 ， 该 端口 输出 密 钥 





统 须 具 备 中 断 解密 、 输 入 新 数据 和 输出 明文 的 功能 。 
有 效 时 ， 每 个 时 钟 接收 一 字 节 
找到 密 钥 后 ， 发 出 该 信号 


表 21-4 DES 破解 系统 的 输入 和 输出 
名 称 
cipherText 8 . 
当 密 文 的 下 一 个 有 效 字 节 装 和 人 时， 发 出 该 信号 
当 系统 能 够 接收 一 个 密 文字 节 时 ， 发 出 该 信号 
1 
1 





表 21-5 DES 破解 系统 中 的 可 见 状 态 














名 称 宽度 描 PË 
key 56 当前 用 到 的 DES 密 钥 
cipherTextBlock 64 待 解密 的 密 文 块 
block Number 16 当前 正在 解密 的 密 文 块 号 
mode 2 当前 模式 : idle, dataln, cracking 
cipherTextStore 512 存储 的 密 文 块 


表 21-6 DES 破解 系统 的 工作 模式 


复位 或 文本 块 成 功 解密 后 : 在 发 出 cipherTextValid 信号 读 取 新 数据 前 ， 保 持 空闲 状态 





读 取 数据 并 存储 ， 一 次 读 入 一 字 节 
cracking 系统 连续 迭代 搜索 可 能 的 密 钥 ， 直 到 匹配 为 目 





21.2.3 音乐 播放 器 


整体 描述 : 音乐 播放 器 能 够 从 RAM 中 读 取 一 首 歌曲 ， 然 后 将 其 合成 为 音频 波形 。 歌 曲 以 
音符 的 形式 存储 在 RAM 中 ， 每 个 音符 持续 100 ms。 合 成 器 的 输出 作为 音频 编译 码 器 的 输入 。 
编译 码 器 每 20. 8 ps(48 kHz) 输 入 一 个 新 的 数据 ， 输 入 格式 采用 s0. 15 表示 法 。 刚 开始 设计 时 
要 求 每 次 只 能 播放 一 个 音符 ， 随 后 会 要 求 能 输出 该 音符 的 多 次 谐 波 。 

输入 和 输出 : 表 21-7 所 列 为 音乐 播放 器 的 输入 和 输出 。 假 定 音 乐 播放 器 的 RAM 中 预 装 了 
一 首 歌 。 用 户 只 需要 标 出 播放 的 起 始点 。 几 个 周期 后 ， 下 一 次 的 value 值 被 输出 且 valueValid 为 
高 。 该 值 一 直 保 持 不 变 ， 直 到 编译 码 器 发 出 next 信号 请 求 下 一 次 计算 为 止 。 

状态 : 音乐 播放 器 的 各 个 状态 如 表 21-8 所 示 。noteNumber 表示 当前 播放 的 音符 。 该 音符 
从 RAM 中 读 出 并 被 转换 成 频率 。 该 频率 值 为 0. 16( 单 位 是 弧度 ) ， 表 示 采 样 频率 为 48 kHz 时 两 
个 样 点 之 间 的 间隔 。 值 为 1 表示 样 点 之 间 的 弧度 为 T， 或 音符 频率 为 24 kHz( 该 频率 人 耳 无 法 
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听 到 ) 。 根 据 频 率 和 时 间 ， 合 成 器 计算 谐 波 并 输出 波形 。 
模式 : 音乐 播放 器 只 有 两 种 模式 : playback 和 idle， 如 表 21-9 所 示 。 用 户 只 能 从 idle 状态 
进入 playback 状态 ， 且 直到 歌曲 播 完 为 止 。 


表 21-7 音乐 播放 器 的 输入 和 输出 












描 Ë 








开始 播放 选 定 歌曲 

声音 波形 当前 值 ， 每 隔 20. 8 hs 输入 一 个 新 的 数据 
表示 输出 值 有 效 

编译 码 器 已 准备 好 接收 下 一 个 值 





value 


valueValid 十 输出 


next 输入 

















表 21-8 音乐 播放 器 的 可 见 状态 























名 称 宽度 HOR 
noteNumber 16 歌曲 中 待 合成 的 音符 
noteFrequency 0.16 当前 音符 的 频率 
time 12 当前 时 间 步 长 ， 单 位 20. 83 jus; 每 一 个 音符 持续 4800 步 
mde 1 “BJ aka k 


表 21-9 音乐 播放 系统 的 工作 模式 






fe Ë 
无 音乐 播放 
音频 输出 














idle 





playback 





21.3 系统 划分 


系统 在 设计 时 通常 会 被 划分 成 多 个 模块 ， 常 见 的 划分 方式 是 按照 状态 、 任 务 或 接口 来 划 
分 。 大 多 数 系统 在 划分 模块 时 将 这 三 种 方式 结合 起 来 。 这 种 划分 可 能 是 分 层次 的 ， 每 一 层 会 采 
用 不 同 的 划分 方式 。 例 如 ， 一 个 系统 可 以 先 按 任务 进行 划分 ， 然 后 将 某 一 个 任务 分 成 几 个 状 
态 ， 或 者 再 将 另 一 个 任务 划分 成 若干 个 接口 。 

采用 状态 划分 方式 ， 可 以 将 系统 划分 为 几 个 与 不 同 状 态 相关 联 的 模块 (这 些 模块 对 用 户 可 
见 或 严格 地 说 是 内 部 模块 ) 。 每 个 模块 负责 维护 系统 中 的 不 同 状态 及 自身 与 其 他 模块 之 间 的 
通信 。 

采用 任务 划分 方法 ， 可 以 将 系统 功能 划分 为 多 个 任务 ， 每 一 个 功能 模块 与 一 个 任务 关联 。 
一 个 任务 还 可 以 划分 成 一 系列 的 子 任务 ， 第 23 章 介绍 的 流水 线 技术 就 是 将 一 个 大 任务 分 解 为 
一 系列 的 子 任务 ， 每 个 子 任务 模块 的 输出 与 下 一 个 子 任务 的 输入 相连 。 采 用 主 - 从 划分 方式 ， 
可 以 将 系统 划分 成 一 个 主 模块 和 多 个 从 模块 ， 其 中 主 模块 负责 监督 从 模块 的 工作 ， 即 向 从 模块 
发 送 任务 并 处 理 它们 的 响应 。 采 用 资源 划分 方法 ， 可 以 将 模块 与 一 个 共享 资源 相连 ， 并 根据 仲 
裁 结果 访问 资源 。 例 如 ， 在 一 个 复杂 系统 中 ， 存 储 器 模块 可 以 被 多 个 客户 端 共享 。 再 如 ， 一 个 
路 由 器 中 ， 用 于 路 由 计算 的 模块 可 以 被 多 个 输入 端口 共享 。 采 用 模型 - 视图 -控制 器 ( MVC) 
方式 划分 系统 时 ， 系 统 被 划分 成 一 个 模型 模块 (包含 大 部 分 系统 功能 ) 、 一 个 视图 模块 (负责 所 
有 的 模型 视图 的 输出 ) 以 及 一 个 控制 模块 (负责 所 有 控制 模型 的 输入 ) 。 

将 模块 的 输入 端口 和 输出 端口 连接 起 来 (如 MVC 架构 系统 的 视图 和 控制 部 分 ) 实际 上 采用 
的 是 按 接口 划分 系统 。 这 样 每 个 独立 的 模块 可 以 通过 接口 与 系统 相关 联 。 例 如 ， 一 个 带 DDR3 
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DRAM 接口 的 系统 ， 通 常设 有 一 个 独立 模块 控制 该 接口 ,客户 端 通过 仲裁 共享 使 用 这 个 接口 ， 
并 为 系统 其 余部 分 提供 了 一 个 更 简单 、 更 抽象 的 接口 。 
21.3.1 Pong 

图 21-2 展示 了 如 何 从 两 个 方向 对 Pong 视频 游戏 进行 系统 划分 。 在 水 平方 向 ， 该 系统 划分 
为 模型 、 视 图 和 控制 器 三 个 任务 。 其 中 模型 部 分 在 垂直 方向 又 按照 球 、 球 拍 、 得 分 、 模 式 等 状 
态 进 一 步 划 分 成 几 个 独立 的 模块 。 图 中 还 给 出 了 模块 之 间 的 接口 定义 。 大 多 数 情况 下 ， 模 块 只 
是 简单 地 将 全 部 或 部 分 状态 (例如 ，score、ballPos ) 输出 。 


控制 器 模型 视图 


serve, start 








ballPos 


leftPadY 


rightPadY ballPos 









leftUpDn 


rightUpDn 状态 机 


leftPadY 


rightPadY 


ballPos 


图 21-2 Pong 游 戏 采 用 MVC 架构 划分 系统 。 比 分 、 球 的 位 置 及 球拍 构成 模型 。 该 模型 在 
VGA 显示 天 上 显示 。 控 制 器 模块 根据 按钮 的 输入 来 控制 模型 。 请 注意 ， 模 型 可 
以 进一步 按照 状态 划分 为 独立 的 球 、 球 拍 和 得 分 模块 


21.3.2 DES 破解 器 


如 图 21-3 所 示 ，DES 破解 器 被 划分 为 几 个 独立 的 模块 。 主 状态 机 作为 系统 控制 器 。 密 文 
存储 模块 用 来 读 取 和 存储 密 文 。 当 主 状态 机 发 出 脉冲 信号 firstBlock( 一 个 周期 )， 密 文 存储 模块 
将 第 一 块 密 文 发 送 到 cipherTextBlock 总 线 上 并 保持 。 主 状态 机 发 出 nextBlock 脉冲 信号 ， 存 储 状 
态 机 输出 下 一 块 密 文 。 密 钥 生 成 器 遍历 一 串 DES 密 钥 ， 以 便 找到 相 匹 配 的 密 钥 。firstKey 和 
nextKey 信号 的 工作 方式 与 firstBlock 和 nextBlock 信号 相同 。DES 的 解密 模块 需要 几 个 周期 才能 
解密 一 块 密 文 ， 完 成 一 次 解密 后 发 出 DESdone 信号 。 最 后 ， 文 本 检查 模块 若 确定 经 解密 模块 解 
密 后 的 “明文 ”的 确 是 明文 时 ， 发 出 isPlainText 信号。 


21.3.3 音乐 合成 器 


我 们 将 音乐 播放 器 分 解 成 一 个 执行 一 系列 任务 的 流水 线 ， 如 图 21-4 所 示 。 音 符 FSM 的 任 
务 是 读 取 内 存 中 歌曲 的 每 个 音符 。 该 音符 在 下 一 个 模块 中 被 转换 成 对 应 的 频率 ， 并 存 人 合成 器 
中 。 合 成 器 FSM 会 根据 每 个 音符 的 时 间 步 长 输出 相应 的 波形 。 计 算 时 涉及 求 正 弦 值 ， 我 们 可 
以 用 一 个 RAM 存储 那些 用 到 的 正弦 值 。 
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plainTextBlock isPlainText 


DESdone 





firstKey 












nextKey 





firstBlock 





nextBlock 


startDES 





图 21-3 按 任 务 划分 的 DES 破解 器 。 这 些 模块 分 别 执行 密 钥 生 成 、 密 文 序 列 化 、 密 文 解密 


及 输出 明文 检查 4 个 功能 。 主 状态 机 模块 控制 整体 的 定时 和 工作 顺序 
ee 


value 


aH [ve | 






存放 四 分 


之 一 正弦 
值 的 RAM 


图 21-4 一 个 按 任务 划分 的 简单 音乐 合成 器 。 音 符 FSM 决定 下 一 个 播放 的 音符 。 音 符 频率 
转换 模块 实现 音符 到 频率 的 转换 。 正 弦 波 合成 器 FSM 用 来 合成 特定 频率 的 正弦 波 


图 21-5 中 的 合成 器 更 复杂 一 些 。 它 包括 两 个 新 的 状态 机 ， 分 别 用 来 计算 谐 波 和 衰减 的 包 络 
线 。 谐 波 FSM 与 合成 器 FSM 相连， 接收 一 系列 格式 为 s0. 15 的 波形 值 。 谐 波 FSM 将 这 些 波形 组 
合 后 ， 输 出 到 包 络 FSM 中 。 包 络 FSM 是 系统 末端 的 一 个 有 限 状 态 机 ， 它 利用 当前 时 间 步 长 ， 经 
过 起 音 衰减 包 络 发 生 器 ， 完 成 对 波形 的 衰减 。 音 符 FSM 发 出 nextNote 信号 后 时 间 计 数 器 重 置 。 

音乐 播放 系统 通过 ready 信和 号 实现 流量 控制 。 编 译 码 器 能 够 输出 下 一 个 波形 时 会 通知 合成 
器 FSM。 播 放 完 一 个 音符 后 ， 正 弦 波 合成 器 向 音符 FSM 发 出 ready 信号 。 


value 
ERRA : 
成 状态 机 谐 波 
nensamoie | 状态 机 


nextNote 






















图 21-5 升级 版 的 音乐 合成 器 。 该 版 本 包含 一 个 正弦 波 合成 器 、 谐 波 FSM、 包 络 FSM。 其 中 正弦 波 合 
成 器 产生 音符 的 多 次 谐 波 ， 谐 波 FSM 组 合 这 些 谐 波 ， 包 络 FSM 通过 起 音 衰减 包 络 发 生 器 对 
波形 进行 调制 
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小 结 


本 章 介绍 了 在 系统 设计 中 ， 如 何 为 一 个 复杂 系统 制定 规格 ， 以 及 如 何 将 系统 分 解 为 可 以 直 
接 设计 的 简单 模块 。 本 章 介绍 了 系统 设计 的 6 个 步骤 : 

1) 规 格 。 

2) 划 分 模块 。 

3) 定 义 接口 规范 。 

4) 时 序 设计 。 

5) 模 块 设计 。 

6) 性 能 优化 。 

接着 通过 三 个 实例 对 前 两 个 步骤 进行 了 详细 讨论 。 在 设计 之 初 制定 规格 是 非常 重要 的 ， 这 
样 可 以 避免 走 回头 路 以 及 在 理解 上 产生 歧义 。 规 格 应 该 提供 足够 的 细节 ， 确 保 不 会 出 现 明显 的 
外 部 特性 ， 避 免 为 日 后 的 设计 留 下 过 多 的 想象 空间 。 

系统 功能 划分 是 系统 设计 的 关键 。 系 统 通常 可 以 划分 成 与 系统 某 个 状态 、 任 务 或 者 接口 相 
关联 的 模块 。 系 统 功能 划分 往往 是 一 个 反复 迭代 的 过 程 。Pong 游戏 采用 的 思路 是 先 将 系统 按 
照 模型 -视图 -控制 器 的 架构 分 解 为 几 个 任务 ,然后 再 将 模型 划分 成 多 个 状态 。 

第 22 ~25 章 将 对 设计 过 程 中 的 后 续 步 又 做 详细 描述 。 


文献 说 明 

DES 标准 [34] 详 细 介绍 了 DES 加密 器 和 解密 器 的 实现 。Oslson 和 Belar 在 文献 [88 ] 中 描述 
T RCA 的 第 一 个 音乐 合成 器 。 这 篇 文章 写 于 1955 年 ， 文 中 提供 了 大 量 真 机 照片 。 

文献 [16] 给 出 了 Pong 视频 游戏 的 实际 框图 。 这 篇 论文 是 Atari 公司 的 副 总 工程 师 在 1977 
年 撰写 的 ， 文 中 给 出 了 原理 图 模块 ， 如 声音 发 生 器 和 比分 跟踪 模块 。 对 于 许多 早期 的 消费 类 电 
子 产品 ， 包 括 视频 游戏 的 描述 可 参阅 文献 [95 ] 。 


习题 

21.1 Pong 的 规格 。21. 2. 1 节 中 给 出 的 Pong 视频 游戏 的 规格 不 完整 。 文 中 列 出 了 该 规格 中 遗漏 的 内 容 。 
请 将 未 详细 说 明 的 问题 尽 可 能 地 找 出 来 ， 并 给 出 它们 的 规格 。 

21.2 DES: 数据 写 入 。 在 DES 方 框图 中 ， 我 们 通过 输入 端 为 密 文 存储 模块 提供 数据 ， 但 是 图 21-3 中 未 
提 及 数据 如 何 产生 。 更 新 框图 使 其 具有 读 取 数据 的 能 力 ， 并 详细 说 明 它 是 如 何 工作 的 。 

21.3 DES; 中 断 。 在 DES 规格 和 方 框图 中 ， 添 加 一 个 输入 中 断 ， 用 来 停止 DES 运算 。 请 详细 说 明 中 断 
发 生 时 的 输出 值 、 系 统 进入 何 种 状态 及 中 断 期 间 发 生 了 什么 。 并 说 明 如 何 从 中 断 中 恢复 ? 

21.4 DES; 明文 输出 。DES 解密 后 ， 我 们 希望 能 够 输出 明文 。 请 定义 该 功能 ， 并 将 其 加 入 系统 方 杠 
图 中 。 

21.5 音乐 播放 器 : 输入 歌曲 。 在 音乐 播放 器 的 规格 和 方 框图 中 ， 添 加 将 歌曲 存 人 RAM 的 功能 。 

21.6 音乐 播放 器 : 暂停 ， 停 止 按钮 。 添 加 停止 和 暂停 歌曲 播放 的 功能 。 并 讨论 当 用 户 再 次 发 出 start 信 
号 时 歌曲 从 何 处 开始 播放 。 

21.7 字符 串 搜 索 。 写 出 字符 串 搜索 器 的 规格 ， 并 对 系统 功能 进行 划分 。 在 一 个 长 字符 串 中 分 别 检索 三 
个 不 同 的 字符 序列 ， 要 求 系统 能 够 输出 搜索 词 出 现 的 次 数 。 

21.8 电梯 控制 器 。 写 出 电梯 控制 器 的 规格 ， 并 对 系统 功能 进行 划分 。 要 求 将 楼 层 请 求 作为 输入 来 控制 
门 的 状态 (打开 或 关闭 ) ， 输 入 目的 楼 层 后 发 出 启动 电梯 运行 的 信号。 
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系统 级 时 序 通常 由 系统 的 信息 流 驱动 。 这 是 因为 信息 流 经 过 模块 之 间 的 接口 ， 而 系统 的 时 
序 又 与 接口 的 定义 紧密 相连 。 根 据 模块 在 接口 处 理 信 息 的 顺序 就 可 以 确定 时 序 。 在 本 章 中 , 我 
们 将 以 第 21 章 介绍 的 系统 为 例 讨 论 接口 时 序 ， 并 阐述 整个 系统 如 何 通过 接口 实现 按 序 工 作 的 。 


22.1 接口 时 序 


接口 时 序 是 发 送 方 和 接收 方 为 传送 数据 所 做 的 约定 。 源 模块 S 向 目的 模块 D 发 送 数据 时 ， 
我 们 需要 知道 数据 在 什么 时 间 有 效 ， 以 及 目的 模块 D 在 什么 时 间 准 备 好 接收 数据 。 换 句 话 说 ， 
源 模块 S 上 的 数据 是 何 时 产生 的 ， 何 时 将 该 数据 发 送 到 接口 的 引 脚 上 ， 以 及 模块 D 又 是 在 何 时 
对 接口 引 脚 上 的 数据 进行 采样 的 。 在 第 17 章 中 我 们 已 经 看 到 了 几 个 状态 机 模块 之 间 的 接口 时 
序 。 在 本 节 中 ， 我 们 将 会 更 深入 地 去 讨论 这 一 问题 。 


22.1.1 BARA 


顾名思义 ， 一 个 常 有 效 信号 表示 该 信号 始终 是 有 效 的 ， 如 图 22-1 所 示 。 一 个 接口 如 果 只 
包含 常 有 效 的 信号 ， 就 不 再 需要 任何 时 序 信号 


ee ch PUL 
图 22-1 常 有 效 接口 不 需要 时 序 信 号 或 流 控制 。 数 据 每 个 周期 都 有 效 ， 接 收 端 可 以 在 任何 时 
间 进 行 采样 

区 分 常 有 效 信 号 与 周期 性 有 效 信号 (第 22.1.2 节 ) 的 关键 是 看 这 个 信号 能 否 保持 一 个 时 钟 
周期 。 一 个 信号 如 果 是 常 有 效 信号 ， 就 表示 该 值 可 以 被 丢弃 或 重复 。 例 如 ， 一 个 温度 传感器 不 
断 地 输出 一 个 8 位 数值 ， 该 数值 表示 当前 温度 ， 是 一 个 常 有 效 信号 。 我 们 既 可 以 把 该 信号 传递 
给 工作 频率 为 时 钟 频 率 两 倍 的 模块 (温度 值 会 重复 ) ， 也 可 以 传递 给 工作 频率 为 时 钟 速度 一 半 
的 模块 (此 时 某 些 温度 值 会 丢弃 )， 模 块 输出 仍 表示 当前 温度 ( 可 能 上 略 有 澡 后 ) o 

图 21-2Pong 视频 游戏 中 所 有 状态 接口 都 是 一 个 常 有 效 接 口 。 接 口中 mode, ballPos, left- 
PadY rightPadY 和 score 信号 都 是 常 有 效 信号 。 这 些 信号 分 别 代表 某 个 状态 变量 的 当前 值 。 

静态 信号 或 常量 信号 是 常 有 效 信号 的 一 个 特例 ， 该 信号 的 值 在 发 生 特定 事件 时 不 会 改变 
(例如 系统 复位 )。 在 处 理 跨 时 域 的 问题 时 ， 静 态 信 号 更 容易 处 理 。 这 是 因为 静态 信号 在 工作 
期 间 不 会 发 生 改 变 ， 因 而 不 需要 同步 。 


22.1.2 周期 性 有 效 信号 

周期 性 有 效 时 序 或 周期 时 序 ( 图 22-2) 表示 该 信号 每 隔 N 个 时 钟 有 效 一 次 。A 代表 信号 的 
周期 。 与 常 有 效 接口 不 同 ， 周 期 性 有 效 信号 的 每 个 值 代表 一 个 特定 的 事件 、 任 务 或 令 牌 ， 该 信 
号 不 能 丢弃 也 不 能 重复 出 现 。DES 破解 器 (第 21.3.2 节 ) 中 密 钥 生成 模块 输出 的 key 就 是 一 个 
周期 性 有 效 接口 (假设 输入 的 nextKey 信号 是 一 个 周期 性 信号 ) 。 该 模块 每 隔 N 个 时 钟 生成 一 
新 的 密 钥 。 每 个 密 钥 代表 一 个 特定 的 任务 (解密 密 文 时 每 个 密 钥 都 要 被 测试 ) ， 因 此 解密 时 不 
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能 随意 丢掉 任何 一 个 密 钥 ， 也 不 能 让 密 钥 重复 出 现 。” 
clk 


data = 











图 22-2 YA Ay HE EN SOL BP 8] I 4530 — A DAE, MLAS IE pt S 
丢弃 或 重复 。 图 中 信号 的 周期 数 NN 为 3 


周期 为 1 的 周期 性 有 效 信号 在 每 个 时 钟 周 期 都 有 效 ， 但 它 与 常 有 效 信号 不 同 ， 因 为 它 的 值 
是 不 能 随意 丢弃 或 重复 的 。 假 如 我 们 按照 图 21-3 设计 DES 破解 器 ， 密 钥 生成 器 每 个 周期 生成 
一 个 密 钥 。 这 是 一 个 周期 为 1 的 周期 性 有 效 信号 ， 我们 不 能 随意 丢弃 也 不 能 重复 使 用 任何 一 个 
密 钥 。 每 个 密 钥 都 要 被 处 理 而 且 仅 能 处 理 一 次 。 

在 处 理 跨 时 钟 域 问题 时 ， 常 有 效 信 号 和 周期 性 有 效 信号 有 很 明显 的 区 别 (第 29 章 )。 常 有 
效 信号 可 以 丢弃 也 可 重复 ， 所 以 常 有 效 信号 跨 时 钟 域 设计 会 很 容易 ， 只 需 避 免 同 步 失败 就 可 以 

a (EE, 周期 性 有 效 信号 在 不 同时 钟 域 传递 时 应 在 一 个 周期 内 完成 。 

当然 ， 如 果 使 用 的 是 周期 信号 ， 发 送 和 接收 模块 必须 在 某 一 点 开始 保持 同步 ， 以 保证 它们 
能 够 同时 计数 到 N。 通 常 只 需 在 复位 时 将 它们 内 部 的 计数 器 初始 化 就 可 以 实现 。 

接口 电路 中 采用 周期 性 有 效 信号 会 使 系统 变 得 很 脆弱 ， 在 大 多 数 情 况 下 ， 应 避免 使 用 带 流 
控制 (第 22.1.3 节 ) 的 接口 。 周 期 性 信号 不 利于 模块 化 。 如 果 为 了 改变 NN 的 值 重 新 设计 一 个 模 
块 ， 所 有 与 该 模块 相连 的 模块 都 需要 改动 ， 这 样 做 可 能 会 带 来 很 多 问题 。 如 果 必 须 采 用 流 控 方 
式 ， 与 其 他 模块 交互 时 要 屏蔽 这 种 变化 。 


22.1.3 流 控制 


带 流 控制 的 接口 可 以 使 用 明确 的 时 序 信号 进行 数据 传送 ， 这 种 用 于 流 控制 的 信号 通常 称 为 
valid( 有效) 信号 和 ready( 就 绪 ) 信 号 。 图 22-3 中 的 接口 就 使 用 了 ready-valid 流 控制 。 当 有 效 数 
据 出 现在 接口 时 ， 发 送 模块 发 出 valid 信和 号。 接收 模块 准备 好 接收 一 个 新 的 数据 时 发 出 ready 信 
号 。 只 有 valid 和 ready 信和 号 同时 有 效 时 ， 才 可 以 进行 数据 传送 。 
周期 1 23 4 5 6 7 8 

ak VPS SSS TU 
data (8) (C XD) 
wad; r Lit J AU T 
ayi LT. T T 
传输 ® © © 


图 22-3 采用 ready-valid 流 控 制 方式 ， 只 有 发 送 方 表明 数据 有 效 且 接收 方 已 准备 好 接收 数 
据 时 ， 才 能 在 两 个 模块 之 间 传 输 数据 或 令 牌 。 如 果 ready 和 valid 二 者 有 一 个 无 效 ， 
传输 不 会 发 生 





数据 传送 时 如 果 采 用 流 控制 接口 ， 发 送 方 或 接收 方 在 传输 前 必须 等 待 另 一 方 。 从 图 22-3 
中 可 以 看 到 ， 传 输 第 一 个 数据 时 发 送 方 在 等 待 接收 方 作出 回应 。 发 送 方 将 A 送 入 data 总 线 ， 





加 ”严格 地 说 ， 密 钥 是 可 以 重复 出 现 的 ， 但 是 多 次 使 用 同一 个 密 钥 是 一 种 无 用 的 重复 工作 ， 会 增加 解密 的 时 间 。 
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并 在 时 钟 1 时 发 出 valid 信号 ， 但 直到 时 钟 2 接收 方 发 出 ready 信号 时 传输 才 真 正 开 始 。 在 第 二 
次 传输 时 ， 接 收 方 在 等 待 发 送 方 的 信号 。 接 收 方 在 时 钟 4 时 就 已 经 发 出 ready 信号 ， 表 明 数 据 
已 准备 就 绪 ， 但 一 直 处 于 等 待 状态 。 直 到 时 钟 5 时 ， 发 送 方 将 B 发 送 到 data 总 线 上 且 发 出 valid 
信号 后 才 开 始 接收 数据 。 

采用 ready-valid 流 控 制 接口 时 ， 如 果 ready 和 valid 信号 有 一 个 为 低 就 无 法 进行 数据 传输 。 
图 22-3 中 我 们 可 以 看 到 ， 第 三 次 数据 传输 时 ，ready 信号 在 时 钟 6 时 为 高 ， 但 接收 方 一 直 未 接 
收 数据 ， 直 到 时 钟 7 发 送 方 准备 好 数据 且 valid 有 效 时 才 开 始 接收 。 当 ready 和 valid 信号 同时 为 
高 ， 每 个 时 钟 周期 传输 一 个 数据 ， 例 如 图 中 时 钟 8 时 数据 D 的 传输 。 

如 果 两 个 模块 有 一 个 始终 处 于 数据 传输 状态 ， 接 口中 的 这 两 个 信号 可 以 减少 为 一 个 。 例 
如 ， 图 21-4 中 音乐 播放 器 的 流 控制 信号 valid 可 以 省 掉 ， 只 需要 提供 ready 信号 就 可 以 了 。 
ready 信号 有 效 时 (或 编译 码 器 的 next 信号 ) ， 假 定 发 送 模块 已 经 准备 好 有 效 的 数据 。 这 种 由 接 
收 方 单 向 控制 传输 的 方式 ， 有 时 也 称 为 pull( 拉 ) 时 序 控制 ， 这 就 好 像 接收 器 是 发 出 ready 信号 
将 数据 拉 了 过 来 。 

同样 如 果 一 个 接口 仅 提供 valid 信号 ， 这 也 是 一 种 单 向 的 流 控 制 方式 。 在 发 送 下 一 个 数据 
前 ,假定 接收 方 已 经 准备 好 接收 数据 。 因 为 发 送 方 在 valid 有 效 时 ， 将 数据 推送 出 去 ， 我 们 把 
这 种 控制 方式 称 为 push( 推 ) 时 序 控 制 。 

在 某 些 情况 下 ， 不 需要 单独 设立 valid 信号 ， 可 以 把 该 信号 编 入 数据 信号 中 ， 用 未 使 用 的 
或 无 效 的 数据 代码 来 表示 数据 无 效 。 按 照 这 个 约定 ， 当 有 效 数据 出 现在 数据 端口 时 ， 表 示 数 据 
有 效 。 这 时 还 是 需要 ready 信号 的 ， 因 为 接收 方 没有 其 他 途径 来 表示 能 否 接收 数据 。 

在 某 些 情况 下 ， 发 送 模块 提前 获得 一 些 数据 是 很 有 用 的 。 这 可 以 通过 在 发 送 器 和 接收 器 之 
间 插 入 一 个 FIFO 缓冲 区 实现 。FIFO 能 够 存储 几 个 字 ， 其 输入 和 输出 端口 均 采用 ready-valid JZ 
口 。FIFO 不 为 空 时 ， 表 示 输 出 有 效 ; FIFO 未 满 时 ， 表 示 已 经 准备 好 输入 。 有 关 FIFO 的 具体 细 
节 ， 我 们 会 在 第 23 章 讨 论 。 


例 22-1 流 控制 寄存 器 

设计 一 个 输入 和 输出 均 采 用 流 控制 的 寄存 器 。 该 寄存 器 能 够 将 设计 中 的 那些 长 且 延 迟 高 的 
关键 路 径 分 开 。 

图 22-4 为 该 模块 的 设计 原理 图 。 与 上 游 模块 进行 通信 的 信 由 d, 
ZZ d (EMMA). n (输出 就 绪 信 号 ) 以 及 v (和 输入 有 效 信 4 
号 ) ; 向 下 游 模块 传输 数据 的 信号 是 di( 输 出 ) n (MEA) Fev, 
(输出 ) 。 设 计 这 个 模块 时 ， 我 们 特意 不 接 入 任何 组 合 逻 辑 电 . 
路 。 这 样 做 的 目的 是 为 了 消除 长 的 延迟 路 径 。 

在 每 个 周期 里 ， 如 果 无 有 效 数 据 输 入 时 (vi = 0)， 有 效 寄 
存 器 和 数据 寄存 器 存储 的 是 上 游 模块 的 值 。 缓 冲 区 也 向 上 游 发 ”< o<] 
出 准备 接收 新 数据 的 信号 (r =1)。 当 有 效 数据 存 入 寄存 器 时 
(vs =1) ， 数 据 寄 存 器 被 禁用 ， 存 入 寄存 器 的 数 保持 不 变 。 如 图 22-4 例 22-1 中 描述 的 流 控 
果 下 游 模块 还 没有 准备 好 ，vi 保 持 高 电 平 ，r 保持 低 电 平 。 待 制 寄存 器 的 原理 图 
下 游 模 块 准备 就 绪 后 会 发 出 信号，v, 信 号 在 下 一 个 周期 变 为 无 效 。 由 于 仅 有 一 个 寄存 器 且 各 
段 之 间 没 有 组 合 罗 辑 电 路 ， 该 模块 每 隔 一 个 周期 才能 接收 新 的 数据 。 习 题 22. 6 要 求 对 该 设计 
进行 改进 ， 使 数据 传输 率 提高 一 倍 。 

无 论 采 用 常 有 效 还 是 周期 性 有 效 方式 ， 该 寄存 器 内 部 的 D 触发 器 在 每 个 时 钟 沿 更 新 。 设 计 
者 必须 认识 到 ， 与 非 周期 输出 相 比 ， 周 期 性 给 出 会 晚 一 个 时 钟 周期 。 这 可 能 需要 对 下 游 模块 进 
行 适当 地 改动 。 
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22.2 接口 划分 与 选择 


接口 的 数据 部 分 通常 可 以 按照 功能 划分 成 多 个 字段 。 例 如 ， 在 图 21-2 的 Pong 游戏 系统 中 ， 
模型 子 系统 的 输出 部 分 包含 5 个 字段 ， 分 别 代表 不 同 的 状态 变量 。 再 往 下 进行 细 分 ， 球 拍 FSM 
具有 一 个 常 有 效 接口 ， 包 含 两 个 数据 字段 : leftPadY 和 rightPadY。 球 FSM 只 输出 一 个 信号 ball- 
Pos。 但 该 信号 在 逻辑 上 可 分 为 X 分 量 和 YY 分量 ， 即 ballPos. X 和 ballPos.Y。” 

一 个 接口 如 果 具 有 多 个 数据 字段 ， 往 往 可 以 根据 一 个 字段 来 确定 其 他 字段 的 含义 。 例 如 ， 
根据 图 18-13 中 微 代码 指令 的 第 一 字段 就 能 够 确定 其 余 字段 的 含义 。 

设计 接口 时 通常 将 字段 分 为 控制 字段 、 地 址 字段 和 数据 字段 。 接 口 的 控制 和 地 址 字段 具有 
选择 功能 。 控 制 字段 选择 要 执行 什么 操作 ， 地 址 字段 选择 在 哪里 执行 操作 。 例 如 ， 在 存储 器 系 
统 中 ， 控 制 字段 可 以 用 来 进行 读 、 写 、 无 操作 、 刷 新 、 设 置 参数 以 及 其 他 操作 。 地 址 字段 用 来 
选择 读 取 、 写 人 或 刷新 的 地 址 或 参数 。 数 据 字 段 用 来 提供 (或 接收 ) 相关 操作 的 数据 。 无 论 数 
据 字段 、 地 址 字段 还 是 控制 字段 都 要 按 第 22. 1 节 中 描述 的 时 序 工作 。 


22.3 接口 的 串 行 化 与 分 包 

当 接 口 位 宽 较 低 时 ， 如 果 想 传送 一 个 大 的 数据 ， 可 以 采用 串 行 传输 方式 。 此 时 可 以 将 大 数 
据 分 成 几 段 ， 通 过 多 个 周期 完成 传送 ， 每 个 周期 传送 一 部 分 。 例 如 ， 假 设 一 个 接口 每 4 个 周期 
传送 一 个 64 位 的 数据 。 如 图 22-5 所 示 ， 我 们 可 以 通过 一 个 16 位 的 接口 完成 数据 传送 ， 每 个 周 
期 传送 该 数据 的 四 分 之 一 。 第 一 个 周期 传送 a(a[63:48]) ， 第 二 个 周期 传送 a ， 以 此 类 推 完 
成 全 部 数据 的 传送 。 

串 行 传输 时 ， 对 于 发 送 方 和 接收 方 必 须要 有 一 个 约定 来 确定 数据 开始 传送 的 时 间 。 这 可 以 
通过 流 控制 或 使 用 周期 性 有 效 信号 实现 。 图 22-5 中 的 接口 采用 了 单 向 流 控 制 ， 该 接口 用 frame 
信号 表示 每 次 传送 的 第 一 个 周期 。 本 例 采 用 的 是 push 流 控制 。frame 信号 是 一 个 有 效 信 号 ， 同 
时 我 们 假定 接收 器 总 是 处 于 准备 接收 状态 。 如 果 需 要 采用 双向 流 控制 ， 可 以 在 接口 中 添加 一 个 
ready 信号。 


周期 1 2 3 4 5 6 7 8 9 10 1 1 13 
clk 


data ( as XY az X a: X ao X bs X b; X bı X bo jH c Àc Ac A & | 
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图 22-5 串 行 接口 经 多 个 周期 完成 数据 传送 。 本 例 中 frame 信号 表示 每 次 传送 的 第 一 个 周期 ， 
这 是 一 种 push 信号 


采用 流 控制 方式 ， 不 需要 每 4 个 周期 启动 一 次 数据 传输 ， 甚 至 无 须 4 的 倍数 个 周期 启动 一 
次 。 在 图 22-5 所 示 的 例子 中 ， 由 于 在 周期 9 时 ， 发 送 方 没有 数据 传送 ， 链 路 进入 空闲 状态 。 
之 后 在 周期 10 开始 传送 数据 e. AT frame 信和 号， 发 送 方 不 必 等 到 周期 12 再 开始 传送 数据 ,但 
是 如 果 采 用 的 是 周期 性 有 效 信号 ， 则 需要 等 到 周期 12 才 可 以 进行 数据 传送 。 

图 22-5 中 的 接口 采用 了 push 方式 传输 数据 ， 它 使 用 了 两 级 时 序 控制 ， 分 别 是 帧 时 序 和 周 
期 时 序 。 在 单 向 流 控制 中 ， 帧 时 序 由 frame 信号 决定 。 一 旦 开始 帧 传输 ， 剩 下 的 传输 由 周期 时 


日 ”遗憾 的 是 ，Verilog 不 能 分 层 声明 数据 类 型 ( 像 C 中 的 结构 ) 但 System Verilog 可 以 。 对 于 常规 的 Verilog， 像 
ballPos 信和 号 的 子 字段 声明 可 以 通过 宏 定 义 来 实现 。 
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序 控制 (周期 N=1)， 此 时 无 流 控 制 。 当 然 也 可 以 两 级 都 采用 流 控 制 ， 只 要 加 入 valid 信号 就 
可 以 实现 ， 从 而 实现 后 续 数 据 的 串 行 传 输 。 只 要 帧 的 大 小 固定 ,在 帧 级 (传输 的 第 一 个 字 ) 
和 周期 级 (后 续 字 ) 可 以 使 用 一 个 valid 信和 号。 如 果 需 要 采用 双向 流 控制 ， 这 两 级 中 使 用 一 个 
ready 信号 就 可 以 了 。 

AEA LN 0 接口 往往 将 命令 、 地 址 和 数据 串 行 化 ， 然 后 送 入 总 线 传输 ， 如 图 22-6 所 示 。 
图 中 可 以 看 到 ， 该 接口 的 位 宽 为 1 字 节 ， 存 储 一 次 数据 需要 使 用 7 个 周期 。 其 中 第 1 个 周期 传 
送 控制 信息 ， 随 后 用 2 个 周期 传送 地 址 信息 ， 最 后 用 4 个 周期 传送 数据 。 本 例 中 使 用 了 周期 有 
效 和 frame-ready 流 控 制 ， 其 中 frame 信和 号 表明 整个 数据 帧 已 准备 好 ，ready 信和 号 表示 接收 方 已 准 
备 好 逐 周期 接收 数据 。 图 中 可 以 看 到 ， 由 于 周期 6 时 接收 方 没有 准备 好 ， 导 致 周期 7 时 数据 要 
重 发 。 


clk 


bus 














图 22-6 通过 共享 总 线 实现 控制 、 地 址 和 数据 串 行 传输 的 内 存 或 Y 0 接口 。 本 例 中 使 用 了 双 
向 流 控制 ， 其 中 frame 信号 表示 一 个 有 效 帧 ，ready 信号 表示 已 就 绪 ， 接 收 方 准备 逐 
周期 接收 数据 


串 行 接口 可 以 看 成 是 在 进行 分 包 。 每 个 传输 项 是 一 个 包含 许多 字段 的 信息 包 ， 而 且 该 信息 
包 的 长 度 有 可 能 不 固定 。 数 据 包 通 过 一 个 给 定 宽度 的 接口 实现 串 行 传输 ， 到 了 另 一 端 后 还 要 进 
行 串 并 转换 。 数 据 包 中 字段 的 宽度 与 接口 宽度 无 关 。 在 某 个 周期 中 ， 发 送 的 信息 既 可 以 包括 全 
部 字段 也 可 以 包括 部 分 字段 ， 而 个 别 字段 也 可 能 占用 多 个 周期 。 

接口 是 否 采用 串 行 方式 取决 于 它 的 成 本 和 性 能 。 串 行 接口 的 优点 是 可 以 减少 接口 的 管 脚 或 
引线 的 数量 。 缺 点 是 增加 了 等 待 时 间 ， 而 且 串 行 化 、 串 并 转换 及 组 帧 会 增加 设计 的 复杂 性 。 在 
忆 片 内 部 ， 信 号 布线 成 本 小 ， 几 乎 总 是 采用 并 行 方式 。 而 在 片 外 由 于 芯片 管 脚 和 系统 级 的 信号 
成 本 较 高 ， 为 保证 各 引 脚 的 性 能 一 致 ， 通 常 采用 串 行 接口 。 


例 22-2 BARK 

设计 一 个 串 并 转换 器 ， 该 模块 的 输入 宽度 为 1 位 ， 输 出 宽度 为 8 位。 输入 、 输 出 均 采 用 
push 流 控 制 制 。 当 接收 到 8 个 有 效 输入 时 (0, 1, =, 7 位 )， 输 出 有 效 。 

图 22-7 是 该 电路 的 Verilog 设计 程序 ， 图 22-8 是 模块 测试 平台 的 输出 结果 。 设 计 的 总 体 思 
想 是 将 输入 的 每 一 位 与 8 个 D 触发 器 中 的 一 位 对 应 (最 低位 在 前 )。 程 序 采 用 了 一 个 ( 独 热 编 
码 ) 计数 器 记录 下 一 个 要 写 入 的 位 ， 输 入 有 效 时 ， 每 个 周期 移动 一 位 。 在 Verilog 程序 中 ， 用 
寄存 器 存储 三 种 状态 : 

1) en_out: nn 位 长 的 独 热 信号 ， 对 写 入 囊 并 转换 器 的 下 一 位 编码 ; 

2) dout: 并 行 化 后 的 数据 ， 直 接 馈 送 到 输出 (每 个 触发 器 的 使 能 端 由 en_out 信号 
控制 ; 

3) vout: 当前 周期 (第 8 位 被 捕获 时 所 在 的 周期 ) 输出 有 效 。 

图 22-8 为 串 并 转换 器 的 输出 ， 输 入 包括 全 0 和 全 1 的 情况 。 与 例 22-3 中 定义 的 时 序 表 比 
较 ， 可 以 验证 该 模块 时 序 是 否 正 确 。 
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module deserializer(clk, rst, din, vin, dout, vout) ; 


parameter width_in = 1; 


parameter n = 8; 


input clk, rst, vin; 
input [width_in-1:0] din; 


output [width_in*n-1:0] dout; 


output vout; 


wire [n-1:0] en_nxt, en_nxt_rst, en_out; 
assign en nxt = vin ? {en_out[n-2:0], en out[n-1]} : en out; 


assign en nxt rst = rst ? {{n-1{1'b0}}, 1’b1} : en_nxt; 


DFF #(1) cnts [n-1:0] (clk, en_nxt_rst, en out); 
DFFE #(width in) data[n-1:0] (clk, rst ? {n{1’b1}} : en_out, 
rst ? {width _in{1’b0}} : din, dout); 
wire vout_nxt = “rst & en_out[n-1] & vin; 
DFF #(1) vout_r(clk, vout_nxt, vout); 


endmodule // deserializer 








E 22-7 í| 22-2 中 采用 push 流 控制 的 串 并 转换 器 的 Verilog 代码 











# vin: 1 din: 1 vout: 0 dout: 00000000 en: 00000001 
# vin: 1 din: 1 vout: 0 dout: 00000001 en: 00000010 
# vin: 1 din: 1 vout: 0 dout: 00000011 en: 00000100 
# vin: 1 din: 1 vout: 0 dout: 00000111 en: 00001000 
# vin: 1 din: 1 vout: 0 dout: 00001111 en: 00010000 
# vin: 1 din: 1 vout: 0 dout: 00011111 en: 00100000 
# vin: 1 din: 1 vout: 0 dout: 00111111 en: 01000000 
# vin: 1 din: 1 vout: 0 dout: 01111111 en: 10000000 
# vin: 1 din: O vout: 1 dout: 11111111 en: 00000001 
# vin: 1 din: O vout: 0 dout: 11111110 en: 00000010 
# vin: 1 din: 0 vout: 0 dout: 11111100 en: 00000100 
# vin: 1 din: 0 vout: 0 dout: 11111000 en: 00001000 
# vin: 1 din: 0 vout: 0 dout: 11110000 en: 00010000 
# vin: 1 din: 0 vout: 0 dout: 11100000 en: 00100000 
# vin: 1 din: 0 vout: 0 dout: 11000000 en: 01000000 
# vin: 1 din: 0 vout: 0 dout: 10000000 en: 10000000 
# vin: 1 din: 1 vout: 1 dout: 00000000 en: 00000001 
# vin: 1 din: 1 vout: 0 dout: 00000001 en: 00000010 
# vin: 1 din: 1 vout: 0 dout: 00000011 en: 00000100 
# vin: 1 din: 1 vout: 0 dout: 00000111 en: 00001000 
# vin: O din: 1 vout: 0 dout: 00001111 en: 00010000 
# vin: 1 din: 1 vout: 0 dout: 00011111 en: 00010000 
# vin: O din: 1 vout: 0 dout: 00011111 en: 00100000 
# vin: 1 din: 1 vout: 0 dout: 00111111 en: 00100000 
# vin: 1 din: 1 vout: 0 dout: 00111111 en: 01000000 
# vin: 1 din: 1 vout: 0 dout: 01111111 en: 10000000 
# vin: 1 din: 1 vout: 1 dout: 11111111 en: 00000001 











图 22-8 验证 例 22-2 和 图 22-7 时 的 一 组 输出 数据 
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22.4 同步 时 序 

一 些 接口 在 工作 时 需要 同步 时 序 ， 如 LCD 显示 器 或 音频 编译 码 器 。 这 些 设备 具有 严格 的 
时 序 约束 ， 为 避免 遗漏 采样 值 ， 每 个 数据 必须 在 规定 时 间 窗 口内 传送 。 由 于 FIFO 的 存在 , .时 
序 约束 可 以 被 看 作 带 边界 的 周期 性 时 序 。 也 就 是 说 ,采样 点 i 必须 在 周期 N(i- B) 和 Ni 间 传 
X., HPN 为 周期 ，B 是 FIFO 缓冲 器 的 大 小 。 接 口 本 身 采 用 流 控制 ， 它 允许 在 时 序 上 有 一 些 
变动 ， 但 流 控 制 信号 必须 在 规定 的 时 间 间 隔 内 响应 。 

例如 ， 图 21-4 中 音乐 播放 器 的 音频 编译 码 器 需要 采用 同步 时 序 。 只 要 系统 其 他 部 件 的 响 
应 速度 足够 快 ， 可 以 采用 push 时 序 实 现 同 步 。 

如 果 一 个 系统 需要 对 资源 进行 仲裁 ， 同 步 起 来 会 有 一 定 的 难度 ， 尤 其 是 仲裁 处 于 多 个 同步 
流 之 间 时 。 等 待 仲裁 要 花费 大 量 的 时 间 ， 必 须 防 止 最 坏 情 况 下 的 延迟 超出 时 序 约束 。 


22.5 时 序 表 


从 第 14 章 开 始 ， 我 们 就 一 直 使 用 图 22-6 那样 的 时 序 图 来 说 明 时 序 关 系 。 这 些 图 的 横 轴 从 
左 到 右 显 示 了 时 间 的 变化 ， 纵 轴 则 表示 的 是 每 个 信号 随时 间 的 变化 ， 要 么 是 一 个 二 进 制 信号 的 
波形 ， 要 么 是 一 组 值 。 尽 管 时 序 图 有 利于 观察 几 个 周期 内 的 二 进 制 信号 ， 但 当 信号 位 数 增多 
时 ， 在 时 序 图 上 显示 波形 就 不 太 方便 了 ， 而 且 我 们 往往 还 希望 看 到 更 多 周期 内 的 波形 。 

如 果 和 希望 看 到 更 多 周期 内 的 波形 ， 或 者 大 多 数 信号 不 是 二 进 制 时 ， 时 序 表 比 时 序 图 更 有 
用 。 表 22-1 Æ 19.4.1 节 中 赫 夫 曼 编 码 器 的 时 序 表 ， 该 表 中 使 用 的 输入 数据 与 图 19-16 中 的 
一 样 。 


表 22-1 19.4.1 节 中 赫 夫 曼 编 码 器 对 字符 串 “THE” 的 编码 时 序 表 



























































无 论 从 水 平方 向 还 是 竖 直 方向 上 看 ， 数 据 都 比较 相似 ， 这 很 容易 让 人 把 它 理解 成 一 个 表 。 
连续 显示 value 的 值 有 助 于 在 移 位 操作 时 观察 结果 。 而 且 ， 两 行 之 间 的 状态 发 生变 化 时 很 容易 
发 现 。 从 图 中 我 们 可 以 清楚 地 看 到 ， 在 某 一 周期 当 irdy 信号 发 出 时 ，char 在 下 一 行 更 新 为 in 的 
值 。 同 样 ， 在 某 一 周期 当 load 信和 号 发 出 时 ，count 和 value 会 在 下 一 行 更 新 。 

例 22-3 串 并 转换 器 时 序 表 

列 出 例 22-2 中 串 并 转换 器 的 时 序 表 。 

从 表 22-2 中 我 们 可 以 看 到 ， 串 并 转换 器 经 过 了 两 次 迭代 (数据 4 和 B)。 每 一 个 周期 当 输 
入 有 效 时 (ival =1) ， 计 数 器 (采用 二 进 制 编码 格式 ) 递增 ， 数 据 存储 在 相应 的 位 置 上 。 当 计 
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KEAT 且 输 入 数据 有 效 时 ,输出 有 效 信 号 (oval =1)。 
表 22-2 ”本 时 序 表 反 映 了 例 22-2 中 串 并 转换 器 的 执行 过 程 














00000004, 
0000004, Ay 

















OAçAsA,A;A;A,.Ao 
A,AgAsAgAyA,A,Ay 
AyAgAsA4A3A,A, Bo 
AyAgAsAqAyAzA, By 


AjAgAsAqAyApB, Bo 


22.5.1 事件 流 


时 序 表 可 以 使 数字 系统 的 事件 流 变 得 清晰 。 事 件 流 是 通过 因果 关系 驱动 系统 运行 的 一 系列 
事件 。 在 赫 夫 曼 编码 器 中 ， 事 件 流 完全 受 计 数 器 的 影响 。 当 计数 器 值 为 2 时 ， 编 码 器 发 出 irdy 
信和 号， 并 将 另 一 个 输入 字符 装 入 字符 寄存 器 中 。 当 计数 器 值 为 1 时 ， 发 出 load 信号 ， 计 数 器 和 
移 位 寄存 器 将 在 下 一 个 周期 加 载 位 串 对 字符 进行 编码 。 

在 一 些 特殊 的 系统 中 ， 事 件 流 由 一 个 关键 的 接口 来 驱动 ， 模 块 间 的 事件 通过 一 个 ready-val- 
id 流 控制 接口 实现 同步 。 


22.5.2 流水 线 和 时 序 预测 


赫 夫 曼 编码 器 中 用 到 了 流水 线 技术 (第 23 章 ) ， 它 能 够 进行 时 序 预测 。 每 次 输入 编码 器 时 
都 需要 经 过 两 级 流水 线 。 例 如 ， 周 期 工时， 一 个 字符 到 达 输 入 端 并 发 出 irdy 信号 ， 周 期 i+1 
时 ,字符 从 输入 寄存 器 输出 ， 从 周期 i+2 开始 ， 长 度 和 该 字符 的 位 串 被 加 载 到 计数 器 和 移 位 
寄存 器 中 。 

由 于 输入 到 输出 有 两 个 周期 的 延迟 ， 控 制 逻辑 必须 预测 当前 字符 所 对 应 位 串 的 结尾 ， 并 提 
前 两 个 周期 发 出 irdy 信号 。 当 计数 器 的 值 为 2 时 ， 下 一 个 字符 装 人 输入 寄存 器 。 提 前 一 个 周 
期 ， 发 出 load 信号 〈 当 计数 器 值 为 1 时 ) ， 将 ROM 的 输出 值 存 人 计数 器 和 移 位 寄存 器 中 。 

当 流 水 线 较 长 且 输 出 字符 串 的 最 小 长 度 为 1 时 ， 时 序 预测 会 变 得 更 加 有 趣 。 


22.6 接口 与 时 序 实例 
下 面 我 们 将 重新 审视 第 21 章 介绍 的 几 个 实例 ， 并 检查 它们 的 系统 时 序 和 接口 时 序 。 
22.6.1 Pong 


Pong 视频 游戏 中 大 量 使 用 了 常 有 效 时 序 控制 。 图 21-2 中 间 这 几 个 模块 产生 了 系统 的 部 分 
全 局 状态 。 例 如 ， 球 FSM 生成 当前 时 间 下 的 和 了 了 坐标。 这些 信 号 总 是 处 于 有 效 状 态 ， 能 够 
在 任何 时 间 点 采样 。 每 个 FSM 根据 其 他 FSM 生成 的 状态 来 执行 相应 的 功能 。 例 如 ， 球 FSM 根 
据 球 拍 FSM 产生 的 球拍 位 置 来 判断 球 是 否 接触 到 球拍 。 需 要 注意 的 是 ， 时 钟 必须 足够 快 ( 相 
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保 在 时 间 步 长 内 不 会 遗漏 某 些 关键 事件 ， 如 球 与 屏幕 的 顶部 相交 或 磁 到 球拍 。 当 需要 显示 时 ， 
VGA 显示 模块 对 4 个 FSM 的 常 有 效 状 态 进 行 采 样 。 

输入 逻辑 发 出 的 信号 采用 单 向 流 控 制 方式 (push 时序)。 常 有 效 信 号 表示 的 是 一 个 连续 状 
态 ， 而 这 些 信 号 代表 的 是 事件 。 当 按 下 一 个 按钮 时 ， 输 入 信号 serve、start、leftUp 、leftDn 、 
rightUp 或 rightDn 中 的 某 一 个 会 出 现 并 持续 一 个 周期 ， 这 表示 出 现 一 个 输入 事件 。 这 些 信和 号 可 
以 被 认为 是 带 隐 含 数据 的 valid 信号 。 也 就 是 说 ， 这 些 信和 号 将 事件 触发 、 数 据 、 球 拍 动作 组 合 
到 一 个 信号 里 了 。 主 FSM 和 球拍 FSM 通过 更 新 状态 来 响应 这 些 事件 。 


22.6.2 DES 破解 器 


表 22-3 给 出 了 DES 破解 器 的 工作 时 序 。 该 破解 器 存储 了 8 个 密 文 块 ， 具 有 一 个 16 周期 的 
DES 描述 器 、1 周期 的 密 钥 生成 器 和 一 个 明文 检查 模块 。 每 16 个 周期 ， 一 个 新 的 密 文 块 被 解 
密 。 在 第 128 个 周期 产生 一 个 新 的 密 钥 ， 然 后 再 次 对 块 0 进行 解密 。 


# 22-3 DES 周期 工作 时 序 。 在 使 用 下 一 个 密 钥 前 ， 系 统 对 全 部 8 块 密 文 进行 解密 。 表 中 FK. 
NK. FB 和 NB 分 别 表 示 first _key、next_key、first_block 和 next_block 信号 


Cycle FK — Key FB | NB | CT block DES Check 
ml | 1 I 


key 0 block 0 
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在 这 个 版 本 的 DES 破解 器 中 ， 事 件 流 完全 由 主 状态 机 模块 中 的 一 系列 计数 器 驱动 。 这 些 
计数 器 按 顺序 驱动 外 围 模块 ， 以 便 与 16 周期 的 DES 解密 模块 实现 同步 。 各 个 模块 ( 密 钥 生成 
器 、 密 文 存 储 和 明文 检验 器 ) 采用 单 向 流 控制 (pull 时序) (请 参阅 第 22. 1. 3 节 ) 。first_key、 
next_key first_block 等 信号 为 ready 信号 ， 当 DES 破解 器 接收 到 某 一 模块 产生 的 数据 时 ， 这 些 
言 号 向 该 模块 请 求 新 的 数据 。 这 些 标 有 first 或 next 的 信号 将 数据 信和 号 与 流 控制 信号 组 合 起 来 ， 


227% HO foR AAAF 347 





在 以 下 情况 时 作出 指示 : 主 状态 机 需要 下 一 个 值 ， 以 及 下 一 次 取 值 是 复位 到 序列 的 起 始 处 ， 还 
是 接着 读 取 序列 的 下 一 个 元 素 。 

该 系统 还 是 一 个 具有 时 序 预测 功能 的 流水 线 。 该 流水 线 经 过 129 个 周期 产生 一 个 新 的 密 
fA, 为 了 能 够 在 第 1 轮 使 用 这 个 密 钥 ， 系 统 需 要 在 第 127 个 周期 时 发 出 next_key 信号 ， 第 128 
个 周期 时 将 密 钥 输入 DES 单元 上 。first_block 和 next_block 信号 也 采用 类 似 的 工作 时 序 。 

为 了 提高 DEC 破解 器 的 解密 速度 ， 可 以 使 用 一 种 灵活 的 工作 时 序 ， 即 只 要 发 现 一 块 明文 
检查 未 通过 就 结束 当前 的 解密 ,然后 开始 尝试 用 下 一 个 密 钥 解密 。 表 22-4 列 出 了 采用 这 种 处 
理 方式 的 工作 时 序 。 可 以 看 到 ，DES 单元 在 第 16 个 周期 完成 密 文 块 0 的 解密 ， 在 第 17 个 周期 
输出 明文 块 ， 同 时 在 该 周期 明文 检查 模块 对 块 0 进行 检查 ， 并 发 出 明文 错误 信和 号。 系统 根据 该 
信和 号 在 第 17 个 周期 发 出 next_key 和 first_block ° 新 的 密 钥 和 块 0 在 第 18 个 周期 送 到 DES 单元 
的 输入 端 。 同 时 在 该 周期 发 出 start_DES 信和 号 ( 即 表 中 的 SD) ， 此 时 已 进入 DES 解密 第 2 轮 的 
块 1 被 中 断 。 如 果 多 数 密 钥 在 解密 第 一 块 密 文 时 就 产生 错误 的 明文 ， 破 解 器 的 性 能 可 以 提高 
7.1 倍 。 两 次 密 钥 的 处 理 间 隔 从 128 个 周期 减少 到 18 个 周期 。 

将 第 17 个 周期 和 第 18 个 周期 所 做 的 操作 采用 了 先行 预测 的 方法 ， 可 以 提高 破解 器 的 效 
率 。 我 们 无 法 在 第 15 个 周期 知道 最 后 一 块 能 和 否 通过 明文 检查 。 但 是 ， 我 们 不 能 等 到 第 17 个 周 
期 再 知道 结果 ， 可 以 在 第 15 个 周期 和 第 16 个 周期 分 别 发 出 next_block 和 start_DES 信号 ， 对 下 
一 个 密 文 块 开始 解密 。 我 们 推测 该 密 文 块 能 通过 明文 检查 并 可 以 继续 后 续 的 操作 ， 请 注意 这 里 
仅 是 假设 。 如 果 在 第 17 个 周期 发 现 这 个 假设 不 成 立 ， 我 们 可 以 在 第 18 个 周期 发 出 start_DES 
信号 ， 取 消 之 前 所 做 的 操作 。 这 样 做 并 没有 比 知 道 结果 后 再 去 操作 糟糕 (时间 方面 > ) 。 但 是 
如 果 假 设 成 立 ， 与 不 采用 预测 方式 相 比 ， 周 期 35 的 操作 可 提前 两 个 周期 完成 。 


表 22-4 改进 后 的 DES 破解 器 的 时 序 表 ( 当前 明文 检查 未 通过 立即 转移 到 下 一 块 ) 


Cycle FK NK KGen FB | NB | CT Check 
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= 设计 师 需要 检查 控制 信号 由 同一 周期 内 的 状态 信号 产生 是 否 会 延长 关键 路 径 。 如 果 会 延长 ， 可 以 将 这 些 信 和 号 


推迟 到 第 18 个 周期 。 
O ”预测 通常 会 带 来 能 量 损失 ， 因 为 预测 工作 会 消耗 能 源 。 
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22.6.3 音乐 播放 器 


最 后 我 们 讨论 一 下 图 21-5 中 的 同步 音乐 播放 器 。 音 乐 播放 器 的 事件 流 由 同步 编译 码 器 驱 
动 ， 该 编译 码 器 为 获取 一 个 新 的 采样 值 ， 每 20. 83 hs (48 kHz) 发 出 一 个 next 信号 。 这 里 采用 
了 pull 时 序 。 系 统 时 钟 为 10 ns (100 MHz) ， 在 下 一 次 请 求 前 ， 采 样 值 可 以 保持 2083 个 时 钟 周 
期 。 由 于 编译 码 器 之 前 没有 使 用 FIFO 存储 采样 值 ， 该 系统 必须 实时 计算 每 个 采样 值 。 

音乐 播放 器 的 工作 时 序 如 表 22-5 所 示 。 在 使 用 ready-valid 流 控制 方式 前 ， 任 务 链 中 的 每 一 
个 模块 采用 拉 取 方式 向 上 一 模块 发 出 请 求 。 在 0 周期 ， 编 译 码 器 向 包 络 模块 发 出 next 信号 ， 触 
发 谐 波 FSM 发 出 nextSample 信号 。 该 信号 使 正弦 波 合成 器 向 前 执行 一 步 (20. 83 ps) 并 在 周期 
2 输出 基 波 值 。 谐 波 单元 在 第 3 个 周期 发 出 nextHarmonic 信号 ， 请 求 二 次 谐 波 。 合 成 器 在 第 5 
个 周期 回复 一 个 valid 信号 。 以 此 类 推 ， 在 第 8 个 周期 返回 三 次 谐 波 。 直 到 编译 码 器 在 第 2084 
个 周期 发 出 下 一 次 采样 请 求 前 ， 硬 件 处 于 空闲 状态 。 

从 2084 周期 开始 到 2091 周期 结束 ， 在 这 9 个 周期 里 系统 完成 下 一 次 采样 及 输出 两 个 谐 
波 。 这 9 个 周期 序列 每 2084 个 周期 重复 一 次 ， 直 到 合成 器 确定 当前 音符 完成 采样 。 当 给 出 当 
前 音符 最 后 一 次 采样 的 三 次 谐 波 后 ， 合 成 器 在 X+9 周期 向 音符 FSM 发 出 下 一 个 音符 的 请 求 。 
音符 FSM 每 隔 X+2084 个 周期 提供 下 一 个 音符 。 

表 22-5 音乐 播放 器 的 时 序 表 





Cycle next Sample next Harm sine Valid next Note 注释 
0 1 编译 码 器 请 求 下 一 次 采样 
1 1 
2 1 l 基 波 值 
3 1 读 取 二 次 谐 波 
4 l 
5 l 1 二 次 谐 波 值 
6 1 读 取 三 次 谐 波 
7 1 
8 1 1 三 次 谐 波 值 
ne 下 一 次 采样 前 一 直 处 于 空闲 状态 
2084 1 读 取 下 次 采样 的 基 波 值 
2085 1 
2086 1 1 基 波 值 
2087 1 读 取 二 次 谐 波 
2088 l 
2089 l l 二 次 谐 波 值 
2090 1 读 取 三 次 谐 波 
2090 l 
2091 1 1 三 次 谐 波 值 
ses 每 个 音符 重复 4800 次 
X+6 1 读 取 最 后 一 次 采样 的 三 次 谐 波 
X+7 1 
X+8 1 l 三 次 谐 波 值 
X+9 l 请 求 下 一 个 音符 
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小 结 


在 本 章 中 ， 读 者 已 经 学 会 了 如 何 理解 模块 间 的 信号 时 序 ， 以 及 如 何 使 用 时 序 表 来 分 析 系统 
的 工作 时 序 。 

最 简单 的 接口 使 用 常 有 效 时 序 ， 如 Pong 视频 游戏 ， 这 种 时 序 方式 可 以 在 任何 时 间 对 信号 
进行 采样 。 使 用 周期 性 时 序 ， 模 块 每 隔 N 个 周期 产生 一 个 有 效 结果 。 这 种 时 序 系统 往往 很 脆 
弱 ， 如 果 系 统 的 任何 部 分 发 生 改 变 或 某 一 事件 引起 模块 重启 都 会 使 系统 崩 演 。 

如 果 和 希望 接口 的 工作 时 序 更 健壮 ， 可 以 采用 流 控制 方式 。 在 这 种 工作 方式 中 ， 当 接收 方 准 
备 好 接收 数据 时 发 出 ready 信号 ， 发 送 方 有 数据 发 送 时 发 出 valid 信号 。 也 就 是 说 ， 数 据 传送 
HJ, ready 和 valid 信号 都 为 1。 流 控制 可 以 采用 单 向 或 双向 方式 。 单 向 接口 中 只 有 ready 信号 没 
有 valid 信号 时 ,采用 的 是 pull 时 序 。 只 有 valid 信号 时 ， 采 用 的 是 push 时 序 。 

时 序 表 在 设计 阶段 及 系统 时 序 可 视 化 方面 是 一 个 很 有 用 的 工具 。 它 的 垂直 方向 显示 的 是 时 
间 ， 每 个 周期 占 一 行 ， 主 要 信号 则 按 列 排 列 。 

系统 的 请 求 和 响应 之 间 存 在 延迟 。 采 用 时 序 预测 ， 可 以 提前 几 个 周期 发 出 请 求 信号 ， 从 而 
弥补 一 定 的 延迟 。 

仔细 分 析 系 统 ， 根 据 事件 流 可 以 得 到 系统 的 工作 时 序 ， 这 些 事 件 流 反 映 了 主要 时 序 信号 之 
间 的 因果 关系 。 事 件 链 通常 由 到 达 接 口 的 外 部 事件 或 瓶颈 模块 完成 时 触发 。 


习题 

22.1 常 有 效 时 序 。 除 了 传感器 和 游戏 外 ， 给 出 3 个 采用 常 有 效 时序 的 例子 。 

22.2 周期 有 效 时 序 。 除 了 本 书 中 提 到 的 系统 外 ， 给 出 3 个 采用 周期 有 效 时 序 的 例子 。 

22.3 流 控 制 时 序 。 除 了 本 书 中 提 到 的 系统 外 ， 给 出 3 个 采用 流 控制 方式 的 例子 。 

22.4 发 送 数 据 采 用 周期 性 时 序 。 用 Verilog 设计 一 个 模块 ， 该 模块 采用 ready-valid 流 控制 方式 接收 8 位 
数据 ， 发 送 数据 时 采用 周期 性 时 序 (N =5)。 请 解释 当下 一 周期 到 来 时 ， 如 果 模 块 为 空 时 ,该 如 
何 处 理 。 

22.5 接收 数据 采用 周期 性 时 序 。 用 Verilog 设计 一 个 模块 ,该 模块 可 以 定时 接收 (N=10) 8 位 数据 ， 
输出 数据 时 采用 ready-valid 流 控 方式 。 如 果 输 出 没有 准备 好 ， 该 模块 可 以 存储 两 组 数据 。 第 三 组 
数据 可 以 丢弃 

22.6 充分 利用 流 控 制 。 在 例 22-1 中 ， 我 们 设计 了 一 个 模块 对 ready-valid 流 控制 的 通道 进行 缓冲 。 但 是 ， 
这 样 带 来 的 问题 是 每 隔 一 个 周期 才能 接收 新 的 数据 。 为 了 使 吞吐 率 达 到 最 大 ， 请 设计 一 个 模块 ， 
要 求 该 模块 每 周期 都 能 接收 新 值 。 此 外 还 要 求 下 行 接口 到 上 行 接口 不 允许 出 现 其 他 的 组 合 逻 辑 电 
路 (反之 亦 然 )。 设 计时 需要 用 两 个 寄存 器 存储 输入 数据 。 

22.7 基于 信用 的 流 控 制 。 基 于 信用 的 流 控制 可 以 作为 ready-valid 流 控 制 的 一 种 替代 方案 。 发 送 模块 的 
初始 信用 值 为 n。 在 每 个 周期 中 ， 该 模块 的 信用 值 最 小 为 1。 它 可 以 发 出 一 个 8 位 的 数据 和 一 个 有 
效 信和 号。 接收 器 保证 可 以 捕获 到 该 值 。 发 送 一 次 有 效 数 据 后 ， 当 前 信用 值 减 1。 接 收 方 定 时 (J 
期 为 1) 向 发 送 方 发 送 creditRtn 信号 ， 该 信号 将 信用 值 “ 返 回 ” 给 发 送 方 。 只 要 接收 到 ereditRtn 
信号 ， 发 送 方 将 信用 值 加 1。 请 设计 并 采用 Verilog 语言 编写 一 个 发 送 模块 ， 该 模块 的 流 控制 方式 
要 求 是 基于 信用 值 的 。 输 入 信号 包括 一 个 始终 有 效 的 8 位 数据 、reset 及 creditRtn 信号 。 输 出 包括 
valid 信号 和 数据 。 

22.8 #4746, I, JHH Verilog 设计 一 个 模块 ， 该 模块 能 够 采用 周期 性 时 序 (8 个 时 钟 周期 ) 将 64 位 的 数 
据 转 换 成 一 系列 的 8 位 数据 输出 (1 个 时 钟 周期 ) 。 当 输入 数据 被 认为 无 效 时 ， 该 值 会 改变 ， 因 此 
必须 对 输入 数据 进行 存储 。 

22.9 $4740, H, 将 习题 22.8 中 的 64 位 数据 输入 改 为 ready-valid 流 控制 。 输 出 接口 也 采用 ready-valid 
协议 ， 但 传输 粒度 为 帧 级 。 当 输出 端 就 绪 且 输入 数据 有 效 时 ， 输 入 端 连 续 8 个 周期 发 出 8 个 8 位 
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的 数据 包 。 上 行 接 口 到 下 行 接 口 间 不 允许 出 现 其 他 的 组 合 逻 辑 电 路 (反之 亦 然 )。 输 出 端的 最 大 
Ft Bt B/D? 

帧 级 和 周期 级 的 流 控 制 。 用 verilog 设计 一 个 模块 ， 该 模块 输入 端 采 用 帧 级 流 控制 ， 用 8 个 周期 接 
收 串 行 数据 ， 输 出 端 采用 周期 级 流 控制 ， 用 8 个 周期 发 送 串 行 数据 。 

同步 时 序 和 可 预测 性 。 给 出 导致 同步 输出 系统 出 现 不 可 预测 的 三 种 情况 。 针 对 每 个 原因 ， 解 释 如 
何 对 最 坏 情况 进行 约束 。 

时 序 表 ，I。 画 出 习题 22. 8 和 习题 22. 9 中 串 行 接口 的 时 序 表 。 

FÆR, H. E 17-5 中 的 波形 转换 成 时 序 表 ， 不 要 遗漏 任何 相关 信和 号。 

时 序 表 ，II。 画 出 第 22. 6. 1 节 中 Pong 游戏 的 时 序 表 。 从 周期 i 开始 ， 球 处 于 屏幕 的 中 央 ， 每 20 
个 周期 向 左 移动 一 个 像素 。 当 球 到 达 网 格 的 边缘 时 ， 需 要 记录 分 数 (假设 左边 球拍 未 击 中 球 ) 。 
时 序 表 中 应 包括 发 球 、 向 右 开 始 移动 ， 所 有 相关 的 状态 和 控制 信号 。 

DES， 进 一 步 提 高 预测 能 力 。 我 们 发 现 ， 如 果 用 一 个 寄存 器 存储 旧 的 密 钥 ， 在 表 22-4 的 第 1 周期 
就 可 以 生成 新 的 密 钥 。 通 过 一 个 多 路 选择 器 ， 可 以 在 两 个 密 钥 中 选择 一 个 进行 后 续 的 DES 解密 
操作 (通过 发 出 start_DES 信号 实现 )。 假 设 存在 这 个 部 件 ， 重 新 绘制 表 22-4 中 的 时 序 表 。 如 果 
第 一 块 明文 检查 未 通过 ， 两 个 密 钥 的 间隔 会 发 生 什么 变化 ? 

DES， 预 测 失败 。 表 22-4 中 所 做 的 预测 是 预测 成 功 。 即 假设 当前 块 的 明文 检查 可 以 通过 ， 因 此 可 
以 预测 后 面 的 时 序 仍 是 采用 当前 密 钥 对 下 一 个 块 进行 解密 。 我 们 也 可 以 从 另 一 个 方向 做 出 推测 。 
也 就 是 猜测 当前 块 无 法 通过 明文 检查 ， 在 表 22-4 中 15 周期 发 出 new_key 和 first_block 信号 。 如 果 
预测 是 正确 的 ， 我们 将 使 用 新 的 密 钥 继 续 解 密 ， 不 会 产生 延迟 。 但 是 如 果 预 测 不 正确 ， 就 需要 恢 
复 到 适当 的 状态 。 

(a) 在 这 种 情况 下 ， 如 果 系 统 预测 失败 ， 需 要 恢复 ， 要 保存 哪些 状态 ? 

(b) 在 表 22-4 中 添加 一 个 RS 列 (恢复 状态 ) ， 重 新 绘制 该 表 ， 使 该 表 能 够 预测 失败 。 表 中 包含 
两 种 情况 : 密 钥 0/ 块 0 没有 通过 检查 和 密 钥 1/ 块 0 通过 检查 。 

(c) 如 果 第 一 块 明文 不 能 通过 明文 检查 的 概率 是 95% 。 从 整体 上 看 ， 采 用 预测 失败 或 预测 成 功 ， 
哪 一 种 方式 更 快 ? 

DES 和 双向 流 控制 。 假 设 我 们 对 明文 检查 器 进行 了 一 些 改进 ， 将 明文 检查 分 为 两 步 。 第 一 步 花费 
一 个 周期 ，95% 的 块 会 被 排除 。 如 果 该 块 通过 了 第 一 步 ， 在 第 二 步 中 再 花费 6 个 周期 去 排除 其 余 
的 90% 。 请 说 明 如 何 把 这 个 改进 后 的 模块 连 和 人 图 21-3 中 的 DES 系统 ， 该 模块 对 系统 时 序 有 何 影 
响 。 绘 制 出 改进 后 的 系统 时 序 表 。 要 求 表 中 具有 利用 新 模块 进行 快速 否决 和 慢 速 否 决 的 例子 。 
DES， 闲 置 资 源 的 利用 。 表 22-3 中 可 以 看 到 ， 在 128 个 周期 里 密 钥 生成 器 有 127 个 周期 处 于 空闲 
状态 。 为 了 充分 利用 这 一 资源 ， 可 以 实例 化 多 个 DES 译 码 器 ， 请 说 明 如 何 让 这 些 译 码 器 并 行 
工作 。 

(a) 画 出 具有 128 个 不 同 DES 译 码 器 的 时 序 表 。 

(b) 如 果 采 用 表 22-4 中 的 译 码 器 ， 需 要 多 少 个 这 样 的 译 码 器 并 行 工作 ， 请 画 出 工作 时 序 表 。 
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流水 线 是 由 一 系列 的 模块 组 成 ， 通 常 我 们 把 这 些 模块 称 为 功能 段 ， 每 个 功能 段 用 来 实现 整 
个 任务 中 的 某 一 功能 。 这 些 功 能 段 就 像 装 配 线 上 的 一 个 个 工作 站 ， 分 别 实 现 着 装配 线 上 的 每 一 
个 功能 ， 并 把 其 处 理 结果 传递 到 下 一 个 功能 段 。 每 个 功能 段 把 未 完成 的 任务 传 给 下 一 个 功能 段 
后 ， 无 须 等 待 当前 任务 完成 ， 就 可 以 开始 处 理 一 个 新 的 任务 。 因 此 ， 与 从 头 至 尾 采 用 一 个 模块 
相 比 ， 流 水 线 在 单位 时 间 内 可 以 执行 更 多 的 任务 ， 也 就 是 说 ， 流 水 线 具 有 更 大 的 吞吐 率 。 

流水 线 的 吞吐 率 或 单位 时 间 内 的 工作 取决 于 最 坏 的 功能 段 ， 设 计 者 必须 对 流水 线 进行 负载 
均衡 以 避免 出 现 空 闪 和 资源 浪费 。 延 迟 可 变 的 功能 段 可 以 将 所 有 上 游 功能 段 停顿 ， 以 避免 数据 
在 流水 线 中 传播 。 队 列 可 以 使 流水 线 具 有 弹性 ， 在 容忍 延迟 方差 上 优 于 全 局 停顿 信号 。 


23.1 流水 线 基础 

假设 这 里 有 一 个 组 装 玩具 车 的 工厂 ， 组 装 一 台 车 需要 4 步 。 第 一 步 将 木材 加 工 成 车 身 ， 第 
二 步 进行 车 身 喷涂 ， 第 三 步 安装 车 轮 ， 最 后 一 步 将 玩具 车 放 入 包装 盒 。 假 设 每 一 步 花 费 的 时 间 
是 5 分 钟 。 如 果 该 厂 只 有 一 个 员工 ， 工 厂 组 装 一 个 玩具 车 需要 20 分 钟 。 如 果 员 工人 数 为 4， 要 
想 实 现 每 5 分 钟 组 装 一 台 车 可 以 有 两 种 方法 。 一 种 方法 是 让 每 个 员工 介入 全 部 工序 ， 即 4 个 组 
装 步骤 全 都 参与 ， 虽 然 一 辆 玩具 车 的 生产 时 间 仍 是 20 分 钟 ， 但 因为 有 4 个 员工 ，20 分 钟 内 能 
够 组 装 4 辆 汽车 ; 另 一 种 方法 是 让 装配 线 上 的 员工 每 人 只 做 其 中 的 一 项 工作 ， 做 完 后 传 给 下 一 
个 员工 ， 即 采用 流水 作业 。 

数字 系统 中 的 流水 线 就 像 是 一 个 装配 线 。 我 们 把 一 个 整体 任务 分 解 成 多 个 子 任务 ( 如同 生 
产 玩具 车 时 分 成 4 个 步骤 一 样 ) ， 执 行 子 任务 的 独立 单元 称 为 流水 线 的 段 (就 像 流水 线 上 的 每 
一 个 员工 ) 。 这 些 段 以 线性 方式 连接 在 一 起 ， 每 个 单元 的 输出 作为 下 一 个 单元 的 输入 ， 就 像 玩 
具 车 工厂 的 员工 沿 着 装配 线 依次 将 自己 组 装 的 半成品 传递 给 下 一 个 员工 。 

模块 的 吞吐 率 @， 表 示 单 位 时 间 内 该 模块 处 理 问 题 或 执行 任务 的 数量 。 例 如 ， 一 个 加 法 器 
如 果 每 10 ns 执行 一 次 加 法 操作 ， 则 该 加 法 器 的 吞吐 率 为 100 Mops (每 秒 百 万 次 操作 )。 模 块 
的 等 待 时 间 了， 表示 模 块 从 头 至 尾 完 成 一 个 任务 花费 的 时 间 。 例 如 ， 假 定 加 法 器 计算 时 从 输入 
到 稳定 输出 需要 10 ns， 则 等 待 时 间 就 是 10 ns。 等 待 时 间 的 另 一 个 含义 就 是 延迟 。 对 于 一 个 简 
单 的 模块 ， 吞 叶 率 和 等 待 时 间 互 为 倒数 : 8 =1/T。 如 果 我 们 采用 流水 线 或 并 行 方 式 进行 加 速 ， 
二 者 之 间 的 关系 会 比 这 个 式 子 复杂 。 

假设 我 们 需要 把 一 个 模块 (7T=10 ns, @ =100 Mops) 的 吞吐 率 提高 4 信 (这 里 假定 已 经 
对 该 模块 做 了 高 度 优 化 ,已 经 无 法 再 通过 设计 来 提高 吞吐 率 了 ) ， 这 时 可 以 采用 与 前 面 提 到 的 
玩具 车 工厂 相似 的 方法 来 处 理 这 个 问题 。 第 一 种 方法 是 将 已 设计 的 模块 复制 4 份 ， 如 图 23-1a 
所 示 。 图 中 模块 A ~ D 与 原始 模块 功能 完全 一 致 ， 其 中 分 发 模块 将 问题 分 发 给 4 个 模块 ， 收 集 
模块 负责 收集 计算 结果 。 从 图 23-2a 中 可 以 看 到 ， 采 用 这 种 方式 后 可 以 并 行 处 理 4 个 任务 。 由 
于 从 头 到 尾 完 成 一 个 问题 仍然 需要 10 ns， 因 此 等 待 时 间 还 是 10 ns， 但 是 吞吐 率 O 可 以 达到 
400 Mops， 这 是 因为 改进 后 每 10 ns 可 以 处 理 4 个 任务 。 

提高 吞吐 率 的 另 一 种 方法 是 采用 流水 线 ， 如 图 23-1b 所 示 。 这 里 ， 我 们 将 模块 A 分 成 4 个 
子 模块 A1，…，A4。 假 定 我 们 能 够 将 模块 功能 均匀 划分 ，4 个 子 模块 的 延迟 Tv 都 为 2.5 nso 
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但 是 实际 上 我 们 无 法 每 一 次 都 能 均匀 地 划分 模块 ， 这 个 问题 放 在 第 23.6 节 中 讨论 。 段 与 段 之 
间 的 流水 线 寄存 器 用 来 保存 前 一 个 子 模块 的 计算 结果 ， 一 旦 计算 结果 被 保存 ， 该 子 模块 即 被 释 
放 去 执行 下 一 次 计算 。 如 图 23-2b 所 示 ， 该 流水 线 以 交替 的 方式 完成 4 个 任务 。 当 子 模块 Al 
完成 任务 Pl 后 ， 开 始 执行 下 一 个 任务 P2, m A2 继续 Pl 的 工作 。 各 任务 依次 通过 流水 线 ， 每 
个 时 钟 周期 进入 一 个 功能 段 ， 直 到 经 过 A4 完成 整个 任务 。 如 果 我 们 忽略 寄存 器 的 时 间 开 销 ， 
等 待 时 间 依 然 是 了 =10 ns (2.5 ns x4) ， 吞 吐 率 可 以 达到 400 Mops。 采 用 流水 线 后 ， 该 系统 完 
成 一 个 任务 的 时 间 是 2. 5 nso 


a) 





图 23-1 提高 一 个 模块 的 吞吐 率 ， 可 以 通过 两 种 方法 实现 。a) 模块 并 行 化 ，b) 流水 线 











技术 
时 间 时 间 
R? 
a) b) 


图 23-2 图 23-1 中 分 别 采 用 并 行 化 和 流水 线 技术 执行 P1 ，…，P4 四 个 任务 的 时 序 图 


与 使 用 并 行 模块 相 比 ， 流 水 线 不 需要 对 模块 进行 赋值 ， 在 提高 吞吐 率 上 具有 成 本 优势 。 当 
然 ， 流 水 线 也 存在 一 定 的 成 本 开销 。 首 先 ， 流 水 线 的 功能 段 之 间 需 要 插入 寄存 器 。 在 某 些 情况 
下 ， 这 些 寄 存 器 有 可 能 价格 不 菲 。 此 外 ， 流 水 线 实现 比 相应 的 并 行 设计 具有 更 多 的 寄存 器 延迟 
开销 。 

下 面 给 出 的 例子 考虑 了 寄存 器 的 开销 ,假设 每 个 寄存 器 总 的 开销 i = tt tco + = 
200 ps。 对 于 单个 模块 或 并 联 模 块 (图 23-1a)， 只 需要 增加 这 部 分 的 时 间 开 销 ， 即 等 待 时 间 T 
为 10. 2 ns, 4 个 并 行 模块 的 否 吐 率 O 减 小 为 392 Mops (© =4/10.2 =392)。 如 果 采 用 流水 线 方 
式 ， 每 个 段 都 会 存在 寄存 器 开销 。 因 此 ， 等 待 时 间 T AB) 10.8 ns, 吞吐 率 O 减 小 为 
370 Mops (© =1/2.7=370)。 

实际 设计 中 ， 大 多 数 系统 采用 并 行 流水 线 方式 。 设 计 者 通常 将 某 一 模块 设计 成 流水 线 工作 
方式 ， 当 寄存 器 成 本 较 高 时 ， 为 了 进一步 提高 吞吐 率 ， 可 以 复制 出 多 个 流水 线 模块 ， 然 后 让 它 
们 按照 并 行 方式 工作 。 一 般 情况 下 ， 假 如 一 个 模块 的 等 待 时 间 为 7,,， 吞 吐 率 为 8,, ， 占 用 的 面 
积 为 a, ， 重 复 设 置 p 这 样 的 模块 ， 得 出 : 
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= T, bg (23-1) 
— P z 
@ = T (23-2) 
a = plap + a,,) (23-3) 
如 果 同 样 的 模块 设计 成 一 个 n 段 的 流水 线 ， 可 以 得 出 
T = T, +nt,,, (23-4) 
看 = 一 二 (23-5) 
atl + beg 480 
n 1 
a = a, + na, (23-6) |481 


例 23-1 简单 流水 线 | 
某 一 个 模块 执行 任务 需要 10 ns， 计 算 该 模块 的 吞吐 率 、 等 待 时 间 及 时 钟 周期 。 假 设 输入 
和 输出 所 用 寄存 器 延迟 时 间 fs =100 ps。 为 了 提高 性 能 ， 重 复 设 置 10 个 该 模块 实现 并 行 操作 ， 
或 将 该 模块 设计 成 一 个 10 段 的 流水 线 ， 再 次 计算 吞吐 率 、 等 待 时 间 及 时 钟 周 期 。 
该 模块 最 初 的 吞吐 率 、 等 待 时 间 及 时 钟 周期 为 : 
T = Ta +t,, = 10.1 ns 
= + = 99 Mops 


Ti = 10.1 ns 
如 果 重 复 设 置 10 个 模块 实现 并 行 操作 ， 根 据 公 式 (23-1) 和 公式 (23-2), TUFF: 
T = T, + tog = 10.1 ns 
@ = i = 990 Mops 


Ta = 10-1 ns 
如 果 将 该 模块 设计 成 一 个 10 段 的 流水 线 ， 根 据 公 式 (23-4) 和 公式 (23-5), TRAZ): 


T = T, + nt, = 11 ns 





= 909 Mops 


23.2 流水 线 举例 


图 23-3 给 出 3 个 流水 线 的 实例 ， 从 中 我 们 可 以 看 到 流水 线 在 数字 系统 中 是 如 何 应 用 的 。 

图 23-3a 是 一 个 图 形 流水 线 的 工作 过 程 。 该 流水 线 首 先 对 场景 中 提取 的 三 角形 序列 进行 演 
业 ， 然 后 将 泻 染 后 的 片段 进行 合成 ， 最 后 送 入 帧 缓冲 器 显示 。 在 整个 过 程 中 ， 三 角形 经 过 一 系 
列 的 变换 ， 肉 眼看 不 见 的 物体 和 光线 被 过 滤 掉 。 剩 下 的 部 分 被 分 成 一 个 个 小 的 片段 ， 经 着 色 后 
合成 到 帧 缓冲 器 中 ， 这 个 过 程 取决 于 它们 的 深度 和 透明 度 。 图 形 流 水 线 中 的 复杂 着 色 器 对 场景 
进行 泻 染 时 其 吞吐 率 必 须 达到 每 秒 60 帧 (每 帧 16 毫秒 ) 或 更 高 。 

图 形 流水 线 在 着 色 阶段 使 用 并 行 处 理 的 方式 ， 这 样 我 们 就 感觉 不 到 纹理 访问 带 来 的 延迟 。 
对 于 每 个 片段 ， 只 要 访问 过 就 会 被 存 人 纹理 高 速 缓存 。 通 常情 况 下 ， 每 次 访问 都 可 以 命中 ， 且 
速度 很 快 。 如 果 没 有 命中 ， 则 需要 花费 很 长 时 间 从 内 存 中 读 取 。 为 了 避免 因 没 有 命中 带 来 的 延 
R, GPU 在 同一 时 间 处 理 多 个 请 求 。 这 样 可 以 保证 GPU 有 足够 的 工作 去 做 而 不 是 在 无 谓 地 等 ”1482 


354 第 六 部 分 ARI 





待 ， 从 而 隐藏 了 纹理 访问 带 来 的 延迟 。 从 存储 器 子 系统 返回 的 每 个 纹理 与 请 求 的 片段 匹配 后 ， 继 
续 通过 流水 线 向 后 执行 。 值 得 注意 的 是 ， 这 一 过 程 必须 保持 该 片段 的 原始 顺序 ， 否 则 最 终 合成 后 
无 法 获得 正确 的 图 像 。 如 果 纹 理 检 索 也 采用 并 行 方式 ，GPU 的 整体 吞吐 率 还 可 以 继续 提高 。 

在 现代 处 理 器 的 设计 中 往往 也 通过 使 用 流水 线 来 提高 吞吐 率 。 图 23-3b 给 出 了 一 个 简单 的 
5 级 流水 线 。 该 流水 线 的 第 1 阶段 是 从 内 存 中 取出 一 条 指令 ， 第 2 阶段 是 从 寄存 器 中 读数 ， 第 
3 阶段 是 将 操作 数 送 入 CPU 执行 算术 运算 。 如 果 需 要 ,在 第 4 阶段 用 来 访问 存储 器 。 最 后 阶 
段 ， 该 指令 的 结果 被 写 回 到 寄存 器 文件 中 去 。 


三 角形 处 理 流水 线 片段 处 理 流水 线 








c) 
图 23-3 a) 图 形 流水 线 ; b) 处 理 器 流水 线 ; c) 数据 包 处 理 流水 线 


在 CPU 的 流水 线 中 ， 无 论 是 取 指 阶段 还 是 访 存 阶段 都 可 能 去 访问 共享 的 二 级 缓存 ( 见 第 
25.4 节 )。 如 果 出 现 取 指 和 访 存 冲突 ， 访 存 功 能 段 通常 会 赢得 仲裁 。 将 优先 级 赋 给 下 级 功能 段 


名” 取 指 阶段 需要 等 待 ， 直 到 存储 器 访问 结束 ， 才 能 继续 执行 。 
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可 以 避免 发 生死 锁 。 在 CPU MKF, AF FE es Or Ez ANS Ll r Ez gt Uy lal FFF te SCP. AL 
是 ， 这 两 个 阶段 可 以 独占 一 个 或 多 个 寄存 器 端口 。 例 如 ， 寄 存 器 读 取 阶 段 访 问 寄存 器 文件 的 两 
个 读 端 口 ， 而 写 回 阶段 独占 写 端 口 。 需 要 注意 的 是 ， 要 避免 在 寄存 器 文件 写 人 之 前 读 取 寄 存 吕 
的 值 ， 因 为 先前 的 指令 进入 写 回 阶段 时 ， 后 面 的 指令 尚 处 于 寄存 器 文件 读 取 阶 段 ， 此 时 读 取 的 
值 有 可 能 不 是 最 新 的 结果 ， 从 而 造成 计算 错误 。 

图 23-30 中 的 网 络 路 由 器 也 采用 了 流水 线 的 工作 方式 ， 我 们 可 以 看 到 所 有 与 中 央 交 换 机 连 
接 的 输入 /输出 端口 均 采用 了 并 行 流水 线 。 串 行 通信 通道 传送 的 每 一 位 经 过 成 帧 器 对 齐 后 形成 
相应 的 字 ， 然 后 被 分 组 打包 。 下 一 个 阶段 用 来 检测 数据 包 ， 以 确保 数据 包 符 合 规定 的 协议 。 在 
这 个 阶段 可 能 会 丢弃 行为 异常 的 数据 包 ， 并 基于 服务 质量 对 正常 的 数据 包 设 定 优先 级 。 下 一 阶 
段 为 路 由 计算 阶段 ， 该 阶段 可 确定 每 个 数据 包 的 输出 端口 。 这 种 计算 通常 会 涉及 trie 数据 结构 
的 前 缓 搜索， 检索 时 间 可 能 会 不 一 致 。 一 旦 选择 了 某 个 输出 端口 ， 开 关 调度 器 为 分 组 中 的 每 个 
字 安 排 时 除 ， 使 中 央 交 换 机 切换 到 对 应 的 输出 端口 。 在 流水 线 输出 阶段 ， 根 据 数据 包 的 优先 级 
进行 调度 ， 将 数据 从 传输 通道 输出 。 

由 于 流水 线 的 某 些 功 能 段 执行 时 间 不 固定 ， 可 以 将 它 连 到 FIFO 缓冲 器 上 来 平衡 负载 ， 并 
允许 在 等 待 下 级 功能 段 时 继续 接收 数据 包 。 第 23.7 节 我 们 将 详细 讨论 这 些 缓冲 区 。 

对 流水 线 进 行 仔细 设计 ， 可 以 使 延迟 、 香 吐 率 和 成 本 满足 设计 需求 。 通 过 继续 细 分 流水 
线 ， 可 以 平衡 流水 线 之 间 的 负载 并 减少 流水 线 寄存 器 的 宽度 。 在 图 形 流水 线 中 多 次 复制 图 形 处 
理 单 元 (GPU) 可 以 实现 所 需 的 吞吐 率 。 目 前 ， 为 了 提高 性 能 ，CPU 的 设计 趋 于 采用 更 长 的 流 
水 线 ( 约 20 级 )。 


23.3 实例 : 行 波 进位 加 法 器 流水 线 

下 面 我 们 讨论 一 个 更 具体 的 流水 线 ， 图 23-4 是 一 个 32 位 行 波 进位 加 法 器 ， 有 关 该 加 法 器 
的 细节 请 查阅 10.2 节 。 如 果 每 个 全 加 器 模块 从 进位 输入 到 进位 输出 ， 延 迟 4 为 100 ps, 那么 
在 最 坏 的 情况 下 (进位 从 LSB 传 到 MSB) ， 加 法 器 的 延迟 4 = 320. =3.2 ns。 单 独 这 样 的 一 
个 加 法 器 每 3.2 ns 执行 一 次 加 法 运算 ， 其 吞吐 率 为 312. 5 Mops。 假 设 我 们 期 望 吞吐 率 能 达到 每 
秒 10 亿 次 ， 即 每 1 ns 执行 一 次 加 法 运算 ， 就 需要 使 用 流水 线 来 实现 这 个 目标 。 

图 23-4 加 法 器 在 运算 时 ， 任 何 时 间 只 有 一 位 处 于 工作 状 
态 。 例 如 ,输入 后 1 ns 只 有 位 10 处 于 工作 状态 , 位 0 ~9 已 
完成 操作 ,位 11 ~31 还 在 等 待 各 自 的 进位 。(p 和 g 已 经 计算 
出 来 ,但 在 进位 产生 前 无 法 计算 so) 但 是 如 果 在 一 个 32 位 的 
加 法 器 中 使 用 流水 线 技术 ， 就 可 以 做 到 让 32 位 中 的 位 同时 š 
工作 ， 从 而 提高 吞吐 率 。 

对 一 个 部 件 进行 流水 线 设计 ， 首 先 要 做 的 是 把 它 分 成 几 
个 子 模块 。 从 图 23-5 可 以 看 出 ， 该 32 位 加 法 器 模块 被 分 成 
了 4 个子 模块 ， 每 个 子 模块 执行 一 个 8 位 的 加 法 。 输 入 矢量 a 
Al b HES 位 各 划分 为 4 组 ,分 别 表示 为 a,,,, 和 4,,;,。 每 个 8 
位 加 法 器 的 输入 为 ,已 ,以 及 进位 ci, 输出 为 8 位 和 
s BEE c,,s。 每 个 8 位 加 法 器 产生 的 延迟 (从 进位 输入 到 
进位 输出 ) FE ty =82,,. =800 ps， 因 此 在 1 ns 时 钟 周期 内 可 供 
寄存 器 开销 的 时 间 为 200 ps。 图 23-4 32 位 行 波 进位 加 法 器 。 如 

为 了 让 加 法 器 能 够 同时 处 理 多 个 任务 ， 可 以 在 子 模块 之 果 每 段 需要 100 ps， 执 行 
间 插 入 流水 线 寄存 器 。 图 23-6 中 粗 线 所 示 为 插入 寄存 器 的 地 一 次 加 法 的 时 间 是 3. 2 ms 
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Fi. 23-7 是 插入 寄存 器 后 重新 绘制 的 电路 图 。 子 模块 和 插入 的 寄存 器 组 合 在 一 起 形成 流水 
线 的 功能 段 。 流 水 线 寄存 器 R1 插入 第 一 个 8 位 加 法 器 之 后 。 经 过 800 ps， 加 法 的 部 分 和 被 存 
入 寄存 器 R1， 该 寄存 器 由 低 8 位 的 和 sR0;。、 位 8 的 进位 c8RO 及 高 位 3 字 节 的 输入 矢量 


aR0,, s Fl bRO,, * 组 成 ， FE 57 位 。 
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图 23-5 将 32 位 行 波 进位 加 图 23-6 将 32 位 行 波 进位 加 法 器 设计 成 流水 线 。 在 
法 器 分 成 4 个 8 位 加 图 中 粗 灰 线 所 绘 的 位 置 上 插 和 人 寄存器 ， 将 
eat 流水 线 的 各 个 段 分 开 。 从 输入 到 输出 ， 必 

须 经 过 每 一 个 流水 线 寄存 器 


R1 (57 bits) 
R3 (41 bits) 
R4 (33 bits) 





图 23-7 32 位 行 波 进位 流水 线 加 法 器 。 图 中 已 插入 寄存 器 ， 每 个 垂直 区 域 包 含 一 级 流水 
线 。 信 和 号 名 是 在 对 应 流水 线 寄存 器 名 基础 上 扩展 而 来 的 


RI 之 前 的 所 有 信号 (包括 主要 输入 信号 ) 都 标 有 后 级 RO， 表 示 这 些 信号 处 于 流水 线 的 第 
0 级 ,这样 容易 与 其 他 级 流水 线 信 号 做 区 分 。 同 样 在 R 的 输出 端 ， 流 水 线 第 1 级 所 有 信号 标 
有 后 级 R1。 需 要 注意 的 是 ,信号 sR1,。 和 sR2;。 代 表 不 同 的 信号 。 尽 管 它们 都 是 低 字 节 的 和 ， 
但 是 它们 计算 的 时 间 不 同 。 在 信号 上 标注 流水 线 的 功能 段 ， 可 以 很 容易 发 现在 流水 线 中 将 不 同 
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功能 段 信号 组 合 在 一 起 这 个 常见 的 错误 。 人 例如， 表达 式 fooRl&barR2 就 是 错误 的 ， 因 为 不 同 流 
水 线 功 能 段 的 信号 不 允许 组 合 在 一 起 。° 

该 流水 线 的 第 2 级 对 操作 数 第 2 字 节 aR1;.s 和 6bR1;,s 做 加 法 ， 进 位 输入 为 c8R1， 运 算 后 的 
和 及 进位 输出 分 别 用 sR1,5.,, clORI 表示 。 第 2 级 加 法 器 的 输出 结果 ,连同 sR1,.,, aR1,,,,, Al 
bR1, dk 49 位 存 人 寄存 器 R2。 以 此 类 推 . 该 流水 线 的 第 3 级 和 第 4 级 分 别 对 操作 数 的 第 3、4 
字 节 做 加 法 运算 。 流 水 线 第 4 级 输出 到 寄存 器 R4 中 ， 此 时 RA 中 存储 的 数据 为 32 位 的 和 
sSR3 .0 及 进位 输出 c32R3。R4 输出 即 为 计算 结果 s. K c32。 
















周期 

PO 

Pt 

S| pe 

P3 

P4 
时 间 

图 23-8 32 位 行 波 进位 加 法 需 流 水 线 时 序 的 流水 线 图 。 图 中 列 出 了 任务 PO，…，P4 中 各 
字 节 求 和 时 对 应 的 周期 


图 23-8 中 的 流水 线 图 给 出 了 该 流水 线 的 工作 时 序 。 图 中 共有 5 个 任务 PO, =, P4 经 过 该 
流水 线 。 任 务 Pi 在 周期 i 进入 流水 线 ，Pi 中 第 7 (587 +7: 87 位 ) 的 和 在 周期 i+j 计 算出 
来 。 任 务 Pi 经 过 4 个 周期 ， 即 周期 i+4 完成 计算 。 当 周期 4 流水 线 输出 任务 PO 的 结果 时 ， 后 
续 4 个 任务 分 别处 于 流水 线 的 不 同 阶段 。 

行 波 进位 加 法 器 采用 流水 线 后 吞吐 率 获得 了 提高 ， 但 也 增加 了 一 定 的 延 时 。 假 设 流水 线 中 
每 一 个 寄存 器 的 开销 如, 是 200 ps (te =t +tico + 到) ， 每 一 级 流水 线 的 延迟 是 1 ns， 其 中 8 位 
加 法 器 进行 计算 需要 800 ps， 寄 存 器 开销 200 ps。 因 此 ， 当 流水 线 工 作 在 1 GHz A, ARa 
以 达到 1 Gops。 与 未 采用 流水 线 时 花费 的 时 间 3. 2 ns 相 比 ， 现 在 的 流水 线 的 延迟 为 4 ns。 这 个 
时 间 差 主要 来 自 4 个 寄存 器 产生 的 开销 。 

通常 情况 下 ， 如 果 流 水 线 中 各 功能 段 组 合 逻 辑 延 迟 最 大 值 为 和 us ， 则 一 个 流水 线 功能 段 的 
延迟 由 下 式 给 出 : 





bine = t. P big = bag +t, + tico * t, (23-7) 
根据 i,,， 我 们 可 以 得 到 n 级 流水 线 的 延迟 
lipe = Nma + t. ) = n(t,, +t, + taq +b) (23-8) 
吞吐 率 为 
ne (23-9) 
bm + Leo Cones + t, + taco + tk 


23.4 流水 线 停顿 


在 某 些 时 候 ， 会 出 现 某 一 级 流水 线 在 分 配 的 时 间 内 无 法 按时 完成 的 情况 。 例 如 ， 玩 具 厂 在 
车 轮 装 配 时 少 安装 了 一 个 车 轮 。 再 如 ， 处 理 器 流水 线 中 ， 用 来 计算 的 数 还 没有 准备 好 。 当 出 现 
这 种 情况 时 ， 发 现 问题 的 那 一 级 流水 线 必须 将 自己 无 法 完成 工作 这 一 情况 告知 上 游 所 有 功能 


e 这 里 会 存在 一 些 特例 ， 如 停顿 信号 〈 第 23.4 节 ) 和 数据 转发 (习题 23. 10) 。 
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段 。 例 如 ,在 工厂 中 可 通过 按 下 一 个 大 的 红色 按钮 来 完成 ， 而 在 数字 系统 中 则 通过 停顿 信号 来 
实现 。 发 出 这 些 信 号 会 使 上 游 流 水 线 处 于 停顿 状态 ， 直 至 该 信号 无 效 为 止 。 或 者 我 们 可 以 使 用 
一 个 ready 信号 ， 当 需要 停顿 时 将 其 设置 为 0， 即 没有 准备 好 。 这 种 方式 与 第 22. 1.3 节 中 提 到 
的 ready-valid 流 控 制 机 制 很 相似 。 

数字 系统 中 如 果 没 有 停顿 信号 ， 在 停顿 阶段 仍 会 传人 新 的 数据 ， 新 传人 的 数据 将 覆盖 之 前 
的 数据 ， 停 顿 的 任务 会 丢失 。 如 果 设 有 停顿 信号 ， 情 况 则 不 同 。 只 要 不 发 出 ready 信号 ， 寄 存 
器 组 将 不 能 接收 新 的 数据 。 当 出 现 停 顿时 ， 对 于 下 游 流 水 线 而 言 ， 虽 然 仍然 可 以 写 入 触发 器， 
但 不 会 发 出 表明 前 一 级 流水 线 结果 无 效 的 valid 信号 。 

停顿 信号 往往 出 现在 关键 路 径 上 ， 如 图 23-9a 所 示 。 而 且 通 常情 况 下 ， 在 流水 线 的 前 段 不 
会 发 出 停顿 信号 ， 到 了 后 段 才 会 出 现 。 一 旦 出 现 停顿 信号 ， 这 些 信号 必然 向 上 传播 (造成 线 延 
R), 并 与 其 他 停顿 信号 结合 (造成 逻辑 延迟 )。 由 于 valid 信号 只 在 结束 某 一 级 流水 线 时 才 送 
入 寄存 器 ， 因 此 该 信号 不 会 出 现在 关键 路 径 上 。 

图 23-9b 为 每 级 流水 线 中 的 寄存 器 处 理 停顿 的 逻辑 电路 ， 该 电路 逻辑 相对 简单 。 如 果 ready 
信和 号 置 为 0， 寄 存 器 仍 使 用 旧 值 。 如 果 下 游 流 水 线 已 经 就 绪 ， 则 输入 下 一 个 任务 。 

图 23-9c 是 一 个 4 级 流水 线 ， 图 中 可 以 看 到 在 周期 2 时 流水 线 第 3 级 发 生 停顿 。ready 信号 
被 置 为 0， 任务 B 和 C 的 值 将 不 会 传人 下 一 级 。 虽 然 第 2 级 流水 线 的 结果 被 送 入 下 一 级 ， 但 有 
效 位 将 置 为 0。 我 们 将 出 现 的 这 一 情形 在 图 中 用 X\ 表 示 。 
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o) 就 绪 


图 23-9 三 级 流水 线 实例 a) 停顿 信号 ，b) FE, c) 执行 范例 。 如 果 某 级 流水 线 处 
于 停顿 状态 ， 它 会 停止 释放 就 绪 信号 (rR;)。 该 信号 与 上 级 所 有 其 他 就 绪 信 号 结 
合 ， 阻 止 流水 线 寄存 器 打 和 新 的 数据 。 当 第 3 级 流水 线 在 周期 2 还 未 准备 好 时 ， 
上 级 所 有 流水 线 立即 进入 停顿 状态 ， 该 状态 持续 到 第 3 级 准备 好 为 止 
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图 23-10 是 用 Verilog 代码 实现 的 流水 线 缓冲 区 ， 它 能 够 处 理 停顿 。 它 的 输入 信号 包括 : 
upstream data、upstream valid 和 downstrem_ready。 当 无 停顿 发 生 时 ，ready 信 
号 传递 至 上 游 ， 而 其 他 两 个 信号 存 人 寄存 器 。 如 果 流 水 线 确实 需要 停顿 ， 寄 存 器 将 保持 输出 值 
不 变 。 





module single buffer(rst, clk, upstream data, downstream_ready, 
upstream_valid, 
downstream data, upstream ready, 
downstream valid); 


parameter bits = 32; 

input rst, čik; 

input [bits-1:0] upstream_data; 
input downstream_ready; 
input upstream_valid; 
output upstream_ready; 
output downstream valid; 


output [bits-1:0] downstream data; 





assign upstream_ready = downstream_ready; 
wire stall = “upstream_ready; 
wire [bits-1:0] data_nxt = rst ? 0 


: (stall ? downstream_data 
: upstream data); 
wire valid nxt = rst ? 0 
: (stall ? downstream_valid 


: upstream valid); 


DFF #(bits) dataR(clk, data_nxt, downstream_data) ; 
DFF #(1) validR(clk, valid_nxt, downstream_valid) ; 
endmodule // single buffer 








= 


图 23-10 一 个 用 Verilog 实现 的 单 缓冲 区 。 下 级 就 绪 信 号 通过 组 合 逻 辑 传 至 上 级 。 如 有 果 下 级 
流水 线 没有 就 绪 ， 寄 存 器 将 不 能 存 人 新 值 


23.5 Wem 

全 局 性 停顿 信号 带 来 的 问题 是 产生 延迟 。 多 数 系统 无 法 在 一 个 周期 里 传播 停顿 条 件 。 相 
反 ， 在 每 一 级 流水 线 中 我 们 还 需 花费 一 个 周期 将 就 绪 信 号 打 人 触发 器 ， 并 将 其 传 至 上 级 模块 。 
要 做 到 这 一 点 且 不 丢失 数据 ， 必 须 将 缓冲 区 增 大 一 倍 来 保存 寄存 器 中 的 旧 数 据 和 新 数据 ， 直 到 
上 级 流水 线 停止 工作 为 止 。 

图 23-11a 所 示 为 一 个 双 缓 冲 流水 线 。 每 级 流水 线 之 间 设 有 两 个 寄存 器 ， 这 两 个 寄存 器 的 
结构 如 图 23-11b 所 示 。 当 流水 线 第 i 级 尚未 准备 好 时 ， 内 部 ready 信和 号 置 为 0， 这 将 导致 第 :- 
1 级 流水 线 的 输出 结果 被 缓冲 到 第 二 个 寄存 器 中 (第 i-1 级 还 未 收 到 未 就 绪 信 号 )。 在 下 一 个 
周期 中 ,第 i-1 级 流水 线 的 输入 信号 prev_ready, 置 为 0， 从 而 导致 信号 ready, WF. 

图 23-11 所 示 为 两 个 缓冲 器 的 控制 逻辑 。 当 第 i 级 流水 线 准 备 的 时 间 超 过 两 个 周期 时 ,， 信 
号 readyR_i 和 pre_ready, 都 为 1。 这 使 得 每 个 周期 dR, ,都 被 写 入 Rega 中 。 在 第 一 个 周期 内 ， 








int_readyR, 和 prev_ready, ,只 要 有 一 个 发 出 ，RegA 就 不 会 存 人 新 数据 ，RegB 缓存 上 级 流水 线 发 
出 的 数据 。 在 随后 的 周期 里 ， 直 到 第 i 级 准备 就 绪 前 ，RegA 和 RegB 中 的 值 保 持 不 变 。 在 
ready 信号 再 次 发 出 的 第 一 个 周期 ， 寄 存 器 B 的 内 容 送 入 寄存 器 A。 

以 图 23-11c 中 的 执行 过 程 为 例 ， 我 们 可 以 看 到 流水 线 第 3 级 在 周期 2 出 现 停顿 。0 ~1 级 
之 间 的 寄存 器 和 1 ~2 级 之 间 的 寄存 器 未 收 到 该 信号 ， 所 以 任务 D 和 C 的 数据 按 正常 输入 。 为 
了 避免 任务 B 的 数据 丢失 ， 将 其 存 人 2 ~3 级 之 间 的 寄存 器 中 。 到 下 一 个 周期 时 ， 流 水 线 第 2 
级 出 现 未 就 绪 信 号 ， 任 务 D 被 送 入 双 缓 冲 ， 而 第 1 级 在 结束 当前 工作 后 将 E 读 入 寄存 器 。 当 
ready 信和 号 再 次 发 出 时 ， 该 信号 也 被 传播 到 上 级 流水 线 。 在 C 移 人 其 主要 寄存 器 前 第 3 级 功 
能 段 处理 流 水 线 中 的 任务 A 和 B。 由 于 整个 过 程 就 像 数 据 在 滑动 中 突然 停止 并 存 人 双 缓 冲 器 
中 ， 这 种 类 型 的 缓冲 也 被 称 为 防滑 缓冲 器 。 





dR,_,,validR,_, 





图 23-11 a) 一 个 具有 双 缓 冲 的 三 级 流水 线 ; b) 2202682248; c) 执行 范例 。 在 双 缓 冲 流 
水 线 中 ,每 个 停顿 信号 只 传播 到 本 级 起 始 处 。 若 将 停顿 信号 从 关键 路 径 中 移 
除 ， 可 以 减少 系统 的 延迟 。 停 顿 导致 数据 被 写 人 第 二 个 寄存 器 ， 同 时 将 就 绪 状 
S (r) 的 变化 传 至 上 一 功能 段 


双 缓 冲 可 以 减少 延迟 并 提高 系统 的 吞吐 率 。 如 果 将 停顿 信号 从 关键 路 径 中 移 除 ， 模 块 的 运 
行 速度 会 更 快 。 与 全 局 停顿 信号 相 比 ， 额 外 引入 的 寄存 器 会 增 大 面积 开销 。 
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图 23-12 是 一 个 用 Verilog 实现 的 同步 双 绥 冲 。 该 缓冲 器 工作 时 ， 如 果 ready 信号 为 高 电 
平 ， 输 入 值 存 人 第 一 个 寄存 器 data_a 中 。 与 单 缓冲 器 不 同 的 是 ， 这 里 传送 ready 信和 号 是 通 
过 触发 器 实现 的 。 未 就 绪 时 ， 上 级 数据 被 存 人 第 二 个 寄存 器 data_b 中 。 





module double buffer<// Inputs 


parameter bits = 


rst, clk, upstream data, 
downstream_ready, upstream_valid, 
// Outputs 

downstream_data, upstream_ready, 
downstream_valid ); 
32; 


input rst, clk; 





input [bits-1:0] upstream_data; 

input downstream_ready; 

input upstream_valid; 

output upstream_ready; 

output downstream_valid; 

output [bits-1:0] downstream_data; 

wire [bits-1:0] data_a; 

wire [bits-1:0] data_b; 

wire valid_a, valid_b; 

wire [bits-1:0] data a nxt, data b_nxt; 
wire valid a nxt, valid_b nxt; 
assign downstream data = data a; 

assign downstream valid = valid a; 


assign 


rst 


assign 





rst 


assign 


rst 


assign 


rst 


wire 


图 23-12 


data b nxt = 
? 0 
( “downstream ready & upstream_ready ? upstream_data 
: data b); 
data_a_nxt = 
? 0 
(~downstream_ready ? data a 
(upstream _ready ? upstream_data 
: data_b)); 
valid_b nxt = 
? 0 aie 
( downstream ready & upstream_ready ? upstream valid 
: valid b); 
valid a nxt = 
20 


(“downstream_ready ? valid a 


(upstream_ready ? upstream_valid 


: valid_b)); 


upstream_ready nxt = rst ? 1 : downstream_ready; 





一 个 Verilog 实现 的 双 缓 冲 器 。downstream_ready 信号 在 一 个 周期 后 传 至 上 


级 。 如 果 下 级 流水 线 还 没有 准备 好 ， 第 二 个 缓冲 器 (data b) 存储 上 级 流水 


线 数 据 。 


一 旦 该 级 流水 线 就 绪 ，daata_b 数据 移 人 data_a 
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DFF #(bits) dataRa(clk, data_a_nxt, data a); 
DFF #(bits) dataRb(clk, data_b nxt, data_b); 
DFF #(1) validRa(clk, valid_a_nxt, valid_a)j; 
DFF #(1) validRb(clk, valid_b nxt, valid b); 
DFF #(1) readyR (clk, upstream_ready_ nxt, upstream ready); 
endmodule // double_buffer 


图 23-12 (2) 


我 们 将 这 两 类 缓冲 器 的 工作 波形 并 列 显 示 在 图 23-13 H, data0 ~ data4 表示 各 级 流水 线 
的 输入 数据 。 经 过 一 段 时 间 后 ， 将 流水 线 第 3 个 功能 段 中 的 ready 信号 强制 置 为 低 。 从 图 中 
单 缓冲 结构 的 流水 线 中 可 以 看 出 ，ready 信号 为 低 是 一 个 全 局 事件 ， 流 水 线 各 功能 段 停止 接 
收 新 的 数据 。 而 在 双 缓 冲 中 ,我们 看 到 在 一 个 时 钟 内 各 功能 段 依次 进入 就 绪 状 态 。 每 级 的 第 二 
个 缓冲 器 (data ib) 用 来 接收 上 级 传人 的 数据 。 当 本 级 再 次 进入 准备 接收 数据 阶段 时 ， 该 
缓冲 数据 被 移 人 第 一 个 缓冲 器 中 。 

























































































































































































ewr j T LI IT LL LIT ET Ls f LI LI LL LT] 

stage3_ready ! a i 
Single buffer — 一 

ready0 I L | 

ready1 | 

ready2 L. > l 

data0 00 Jaa Jbb jcc jdd Jee ff y0 y2 a 

datai ——{00 laa Ibb jee ydd jee H y0 {21 = 

data2 ———{00 jaa ob jcc ydd jee yf yi0 ya 

data3 ——{00 ja Bb ee C Jee S A Ci, 

datas 一 (oO — (aa [bb Joc jag ee J iro Ji 

valid4 ， r 1 [ = 
Double buffer 

ready0 í u | 

ready1 T L | 

ready2 | 

data0 00 — Jaa [bb Joe Jad yee yi yo ya 

datatb ———{00 piii : 

data! 一 0 Jaa Jb Joe Joad Jee m oa 

data2b — —(00 yod 

data2 — 00 jaa Jb je jad ee J TO CA 

data3b 一 -一 {50 {bb 

data3 —— jaa {bb lec yod jee J yi0 y2 

data4b ——(00 ` ` I I ü : 

data4 {00 yaa Jb yec yaa Joey" yro JT 

valid4 | 4 ~| | 





图 23-13 BRR AML Kae LEBIH BE. 我们 将 stage3 ready 信号 设置 
为 0， 并 保持 两 个 周期 。 单 缓冲 引起 全 局 停顿 (ready; ) ， 没 有 数据 写 入 缓冲 区 。 
采用 双 缓 冲 技术 ，ready 信号 保持 一 个 周期 。data;b 表示 存储 在 第 二 个 缓冲 器 
内 的 数据 
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Gi 23-2 利用 双 缓 冲 减 少 延 迟 

分 别 采 用 单 缓冲 和 双 缓 冲 设计 一 个 10 级 流水 线 ， 计 算 各 自 所 用 的 周期 。 假 设 每 级 有 一 个 
10 ns 的 延迟 (包括 1 ) ， 进 入 停顿 大 约 需 要 8 ns (lu )。 在 各 级 流水 线 间 传送 就 绪 信 号 需要 
Ins (ia)， 这 一 延迟 来 自 产 生 停顿 的 功能 段 。 

采用 单 缓冲 结构 ， 时 钟 周期 由 下 式 给 出 : 

Tu = MAX( T. stay + nta) = max(10,8+10x1) = 18 ns 
采用 双 缓 冲 结构 ， 就 绪 信 号 只 经 过 一 个 功能 段 : 
Tu, = max( Tu t, t t.) = max(10,8 +1) = 10 ns 


23.6 负载 均衡 


设计 一 个 流水 线 时 ,确保 各 功能 段 的 吞吐 率 保持 一 致 很 重要 ， 因 为 系统 的 总 吞吐 率 是 由 最 
慢 的 功能 段 决 定 。 就 像 瓶 子 中 最 细 的 那 一 段 会 限制 水 的 流动 一 样 ， 流 水 线 中 吞吐 率 最 低 的 段 通 
常 被 称 为 瓶颈 段 。 比 瓶颈 段 快 的 上 级 段 ， 为 防止 缓冲 区 溢出 必须 处 于 闲置 状态 。 比 瓶颈 段 快 的 
下 级 段 ， 由 于 在 大 多 数 时 间 里 缺少 输入 数据 ， 也 常 处 于 空闲 状态 。 

图 23-14a 是 一 个 不 均衡 的 流水 线 。 除 了 第 3 段 ， 其 他 段 的 吞吐 率 @ 都 为 1 Gops。 第 3 段 的 
FIER 9; 为 250 Mops。 因 此 ， 整 个 系统 的 吞吐 率 被 限制 在 250 Mops。 时 钟 周期 设置 为 4 ns, 
整个 模块 的 等 待 时 间 是 16 ns。 

为 了 提高 第 3 段 的 吞吐 率 ， 使 该 段 与 其 他 段 相 匹配 ， 可 以 采用 重复 设置 瓶颈 段 的 方法 ， 如 
图 23-14c 所 示 ， 也 可 以 将 该 功能 段 细 分 为 一 个 4 级 的 流水 线 ， 如 图 23-14b 所 示 ， 或 者 把 这 两 种 
方法 组 合 起 来 。 第 3 段 采 用 流水 线 方式 后 ， 该 段 中 各 小 段 每 1 ns 会 产生 一 个 新 的 输出 。 第 3 段 作 
为 一 个 整体 ， 其 等 待 时 间 保持 在 4 ns (包含 寄存 器 的 开销 ) ， 但 是 吞吐 率 增加 了 4 倍 。 如 果 第 3 阶 


Tu=4ns @=250 M T=16 ns 








@=1 Gop 
) T=4 ns, 每 个 


图 23-14 同一 流水 线 三 种 不 同 实现 方式 所 对 应 的 吞吐 率 、 延 迟 和 时 钟 。a) 功能 段 3 限制 了 
整体 的 吞吐 率 。b) 将 功能 段 3 细 分 成 4 个 ns 的 功能 段 ， 使 流水 线 获得 最 大 吞吐 
率 和 低 延 迟 。e) 采用 重复 设置 功能 段 3 的 方式 ， 使 流水 线 达 到 最 大 吞吐 率 
1 Gops， 但 延迟 并 未 达到 最 小 。 在 c) 中 其 他 功能 段 每 4 ns 时 钟 周期 产生 4 个 输出 
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段 无 法 再 细 分 成 流水 线 ， 还 可 以 对 它 进 行 重 复 设 置 。 这 样 做 需要 将 系统 时 钟 设置 为 4 ns， 即 以 第 
3 段 的 延迟 时 间 为 时 钟 周期 。 为 了 在 整体 上 实现 Gops 的 吞吐 率 ， 其 他 段 必 须 在 4 ns 时 间 里 产生 
4 个 结果 。 在 习题 23. 17 中 会 要 求 设计 一 个 流水 线 ， 其 中 第 3 段 采 用 重复 设置 的 方法 ， 周 期 为 ns. 


23.7 可 变 负载 

流水 线 功 能 段 的 延迟 不 是 恒定 不 变 的 。 例 如 ， 译 码 电 影 中 的 一 帧 所 花费 的 时 间 取 决 于 当前 帧 
和 前 一 帧 之 间 的 差异 。 对 于 一 个 刚性 的 流水 线 而 言 ， 若 每 次 下 级 功能 段 处 理 问题 花费 时 间 过 多 ， 
上 级 功能 段 就 会 进入 停顿 状态 。 但 是 在 流水 线 功 能 段 之 间 插 入 先入 先 出 (FIFO， 见 第 29.4 市 ) 
缓冲 区 后 ， 可 以 将 变化 的 吞吐 率 平均 化 ， 使 得 流水 线 整 体 乔 吐 率 依赖 于 各 段 的 平均 吞吐 率 。 

流水 线 上 级 功能 段 将 结果 插入 FIFO， 直 到 该 缓冲 区 充满 为 止 。 下 级 功能 段 从 队列 头 部 获 
取 任 务实 例 ， 直 到 该 缓冲 区 为 空 。 如 果 队 列 已 满 ， 则 上 级 功能 段 停顿 。 如 果 队 列 为 空 ， 下 级 功 
能 段 处 于 空闲 状态 。 

在 这 种 去 耦 系统 中 ， 不 需要 全 局 时 钟 。 只 要 上 级 队列 不 空 或 下 级 队列 未 满 ， 功 能 段 就 一 直 
处 于 工作 状态 。 在 稳 态 条 件 下 不 会 出 现 这 两 种 情况 。 为 了 充分 提高 吞吐 率 ， 各 功能 段 之 间 的 队 
列 必须 足够 深 ， 这 样 才 能 容纳 各 种 不 确定 性 因素 。 队 列 大 小 取决 于 延迟 时 间 的 分 布 和 突 发 性 。 

图 23-15 表明 当 负 载 不 均衡 时 需要 排队 。 流 水 线 功 能 段 A 的 延迟 为 10 个 周期 ， 而 功能 段 B 
的 延迟 为 5 个 或 15 个 周期 。 如 果 两 个 功能 段 之 间 只 有 一 个 单独 的 锁 存 器 ， 如 图 23-15b 所 示 ， 
只 要 B 未 完成 上 一 次 迭代 (条 件 F) ，A 必须 停顿 。 当 这 个 缓冲 区 没有 被 A SAN CRE), 
B 必须 处 于 空闲 状态 。 若 将 缓冲 区 改 为 由 多 个 单元 组 成 ， 如 图 23-15c 所 示 ，A 可 以 连续 工作 且 
不 会 出 现 停顿 。 如 果 B 仍 处 于 忙碌 状态 ， 则 进行 排队 等 候 。 只 要 队列 非 空 ，B 就 不 会 处 于 空闲 
状态 。B 唯一 会 处 于 空闲 的 情况 是 , B 连续 执行 5 个 周期 且 队 列 完全 排 空 后 会 进入 空闲 状态 。 


A B 
10 个 周期 5 个 或 15 个 周期 


a) 
周期 


o 5 10/15 20 25 30,35140 45 50 55 60 65 70 
| |=] | °>] 





c) 
图 23-15 负载 不 均衡 的 流水 线 。 功 能 段 B 花费 5 个 或 15 个 周期 。b) 中 功能 段 A 和 B 之 
间 只 有 一 个 寄存 器 。 当 A 已 经 完成 , 但 B 未 完成 时 (F) ， 功 能 段 A 会 出 现 停 
顿 。B 已 完成 , 但 ARZIR (E), WAER: B EHEH. c) 中 用 一 个 FIFO #Ë 
换 寄存 器 ， 可 以 消除 功能 段 停顿 
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下 面 我 们 详细 讨论 一 个 去 耦 的 流水 线 ， 该 流水 线 某 个 功能 段 延 迟 时 间 不 固定 ， 波 形 如 
图 23-16 所 示 。 该 流水 线 的 功能 段 A 延迟 时 间 固 定 ， 功 能 段 B 的 延迟 时 间 是 可 变 的 ， 两 个 功能 
段 之 间 用 一 个 长 度 为 3 的 FIFO 隔离 。FIFO 与 两 个 功能 段 之 间 的 接口 采用 ready-valid 流 控制 
(WL 22.1.3 47) 方式 。FIFO 发 出 A_ready 信号 表示 缓冲 区 未 满 ， 发 出 B_valid 则 表示 非 空 。 当 
A 发 出 数据 有 效 信 号 且 FIFO 已 就 绪 ，A 中 的 数据 在 时 钟 上 升 沿 写 和 人 FIFO 中 。 第 一 个 可 写 和 人 数 
据 的 寄存 器 ， 称 为 队 尾 。 在 周期 11、12 和 13 时 FIFO 已 满 ，A 必须 停顿 。 当 B 发 出 数据 有 效 
信号 且 FIFO 有 效 时 ，FIFO 会 弹出 数据 并 移动 其 余数 据 。FIFO 连续 地 输出 的 第 一 个 有 效 数 据 ， 
我 们 称 之 为 队 首 。 当 FIFO 在 周期 1、2 和 4 时 为 空 ，B 处 于 空闲 状态 。FIFO 的 大 小 决定 了 A 处 
于 停顿 和 B 处 于 空闲 的 周期 数 。 
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图 23-16 功能 段 之 间 用 FIFO 队列 作为 缓冲 的 可 变 流水 线 工 作 波 形 。 当 队列 为 空 〈B_val- 
id=0) 时 ，B 空间 。 当 队列 已 满 (A_ready =0) BF, A 停顿 


例 23-3 可 变 负载 工作 时 序 

计算 一 个 4 级 流水 线 完成 5 个 任务 花费 的 时 间 。 表 23-1 中 给 出 了 各 功能 段 完成 相应 工作 需 
要 的 时 间 (单位 是 周期 ) 。 例 如 ， 功 能 段 3 处 理 任 务 1 需要 花费 10 个 周期 但 处 理 任务 2 只 
要 花费 一 个 周期 。 先 假设 该 流水 线 中 使 用 了 全 局 停顿 信号 ， 计 算 完成 5 个 任务 共 需 多 少时 间 ; 
然后 假设 各 功能 段 之 间 采 用 FIFO 缓冲 区 ， 再 计算 完成 5 个 任务 花费 的 时 间 。 

面 给 出 使 用 这 两 种 不 同 结构 实现 的 流水 线 的 工作 时 序 。 注 意 ， 表 中 垂直 方向 表示 的 是 时 

间 。 每 栏 表 示 各 段 当 前 正在 处 理 的 任务 。 表 23-2 是 采用 全 局 停顿 信号 的 工作 时 序 图 ， 表 23-3 
是 段 间 采 用 FIFO 的 工作 时 序 图 。 


表 23-1 例 23-3 中 所 描述 任务 的 时 序 : 每 行 表示 一 个 任务 ， 行 中 每 列表 示 当 前 任务 在 各 功能 段 中 
需要 的 时 钟 周期 数 
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R 23-2 Fi 23-3 中 流水 线 执行 一 系列 任务 时 的 工作 时 序 。 流 水 线 采 用 全 局 停顿 信号 ， 执 行 全 部 任 
































































































































务 需要 35 个 周期 
周期 81 S2 | s3 S4 
0 PI 
l P2 | PI 
2 P3 P2 Pl 
， P3 P2 PI 
11 P3 P2 PI 
2 m P " 
13 P5 P4 P3 P2 
e P5 P4 P3 P2 
2 | » | m Ë m 
» | | » Pa 5 
PS P4 P3 
a || 5 Ps P 
s || "s Ps 
x= Í | 5 
表 23-3 例 23-3 中 流水 线 执行 一 系列 任务 时 的 工作 时 序 。 流 水 线 采用 FIFO 缓冲 区 来 解决 负载 不 均 
衡 的 问题 ， 执 行 全 部 任务 需要 26 个 周期 
m | s J| ® | S | ~= 
° | m | 
l P2 Pl 
2 P3 P2 PI 
3 P4 P3 PI 
ll P5 P4 Pl 
12 P5 P4 P2 PI 
13 P5 P4 P3 P2 
«| f] 5 pa Ë 
15 P3 
16 P3 
”| | 
23 P3 
= J| | | s 


23.8 资源 共享 


设计 流水 线 时 ， 价 格 昂贵 且 很 少 使 用 的 资源 可 以 在 流水 线 功 能 段 之 间 共 享 。 例 如 ， 图 23-17a 
中 流水 线 功 能 段 A 和 D 访问 存储 器 采用 的 就 是 共享 方式 。 当 存储 器 价格 昂贵 且 各 功能 段 使 用 
时 间 不 超过 50% 时 ， 共 享 访问 存储 器 是 一 个 很 好 的 方案 。 图 23-17b 中 两 条 流水 线 共享 了 一 个 
模块 。 该 模块 的 功能 是 计算 余弦 值 ， 但 由 于 该 运算 的 使 用 率 非 常 低 ， 故 将 该 模块 共享 出 来 供 
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流水 线 访 问 。 














a) ! b) 
图 23-17 a) 功能 段 之 间 的 资源 共享 ，b) 流水 线 之 间 的 资源 共享 


为 防止 多 个 资源 共享 者 在 访问 共享 资源 时 出 现 冲突 ， 可 设置 仲裁 器 (第 8.5 节 ) 。 在 每 个 
资源 周期 中 ， 共 享 者 在 使 用 资源 时 需 提 出 请 求 。 仲 裁 器 根据 仲裁 逻辑 将 资源 分 配给 其 中 一 个 申 
请 者 。 没 有 获得 仲裁 的 申请 者 将 一 直 处 于 等 待 状态 ， 直 到 获得 访问 该 资源 的 权力 为 止 。 为 了 防 
IESE AR IRIE” SR (多 次 仲裁 失败 ) ， 应 该 使 用 一 种 公平 的 仲裁 器 ， 如 循环 仲裁 器 
(见习 题 8. 13 ) 。 当 某 个 功能 段 或 流水 线 比 另 一 个 更 重要 时 ， 可 以 使 用 优先 级 仲裁 器 。 例 如 ， 
将 权限 授予 下 级 功能 段 会 比 授予 上 级 功能 段 产生 的 停顿 段 要 少 ， 因 此 通常 将 优先 权 授 予 下 级 功 
能 段 ， 这 样 可 以 避免 出 现 死 锁 现象 。 对 共享 资源 进行 仲裁 可 能 会 花费 一 定 的 时 钟 周 期 数 ， 有 时 
这 足以 保证 在 分 享 资源 前 能 够 将 数据 存 人 FIFO。 

当 资 源 使 用 率 较 低 或 者 复制 成 本 较 高 时 ， 资 源 共 享 是 一 种 非常 不 错 的 方法 。 例 如 在 路 由 器 
中 ， 路 由 逻辑 要 计算 数据 包 发 往 何 处 。 每 个 数据 包 仅 在 包头 使 用 一 次 ， 但 是 传输 数据 包 可 能 需 
要 几 十 个 周期 。 正 因为 它 的 利用 率 低 ， 可 以 将 路 由 逻辑 共享 出 来 ， 供 路 由 器 的 多 个 甚至 全 部 输 
人 端口 使 用 。 


小 结 


本 章 介 绍 了 如 何 使 用 流水 线 和 并 行 方式 提高 系统 模块 的 性 能 。 通 过 吞吐 率 和 等 待 时间 这 两 
个 指标 可 以 衡量 一 个 模块 性 能 的 好 坏 。 流 水 线 技术 包括 如 何 将 一 个 模块 分 成 若干 功能 段 ， 并 使 
信息 从 一 个 方向 上 流 经 各 功能 段 。 在 功能 段 之 间 插 入 寄存 器 ， 可 以 使 每 个 功能 段 在 同一 时 间 处 
理 同一 任务 的 不 同 子 任务 。 

并 行 处 理 或 流水 线 可 以 提高 春 吐 率 ， 同 时 使 延迟 基本 保持 不 变 。 将 模块 设计 为 n 级 流水 
Ze, 其 否 吐 率 可 提高 n 倍 ， 等 待 时 间 仅 略微 增加 (ni.。)， 增 加 的 面积 (成本) 只 是 插入 寄存 
右 的 成 本 。 相 比 之 下 ,采用 nn 个 并 行 单元 ， 否 吐 率 也 可 以 提高 n 倍 ,但 面积 上 的 成 本 却 增加 了 
n fo 

如 果 在 规定 的 时 间 里 ， 流 水 线 中 的 功能 段 无 法 完成 自己 的 任务 ， 可 能 会 造成 流水 线 的 停 
顿 ， 所 有 上 级 功能 段 都 会 停止 工作 ， 直 到 该 段 的 工作 处 理 完 为 止 。 双 缓冲 可 以 避免 因 停 顿 带 来 
的 时 序 问题 。 双 缓冲 是 把 功能 段 之 间 的 寄存 器 替换 为 能 够 存储 两 个 或 更 多 的 缓冲 器 。 

一 个 有 效率 的 流水 线 必 须 是 平衡 的 ， 每 个 功能 段 应 该 具有 相同 的 吞吐 率 ， 这 是 因为 整个 流 
水 线 的 吞吐 率 由 最 慢 的 瓶颈 段 决定 。 为 了 平衡 流水 线 ， 我 们 可 以 采用 流水 线 操作 或 对 瓶颈 段 并 
行 化 来 提高 它 的 吞吐 率 。 

当 流 水 线 功 能 段 的 吞吐 率 不 固定 时 ， 可 以 在 各 功能 段 之 间 插 入 FIFO 缓冲 器 进行 均衡 。 如 
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使 用 率 低 的 资源 可 以 在 流水 线 功能 段 之 间或 独立 的 流水 线 之 间 共享 。 当 多 个 共享 者 同时 请 
求 该 资源 时 ， 采 用 仲裁 器 可 解决 访问 冲突 。 香 吐 率 变化 可 能 会 导致 在 共享 阶段 出 现 仲裁 失败 ， 
这 可 以 通过 在 功能 段 之 间 增加 FIFO 缓冲 器 来 缓解 。 


文献 说 明 


IBM 的 7030 (Stretch) 是 第 一 个 采用 流水 线 的 计算 机 [22]。7030 是 20 世纪 60 年 代 初 推 
出 的 ， 它 的 内 存 模块 为 128 KB ， 标 价 数 百 万 美元 。20 世纪 80 年 代 初 ，MIPS 处 理 器 上 使 用 的 是 
一 个 典型 的 5 级 流水 线 [46]。 有 关 CPU 流水 线 的 详细 内 容 ， 可 查阅 参考 文献 [47] 和 [90], 
有 关 网 络 流水 线 的 详细 描述 ， 可 查阅 文献 [33 ] 。 享 利 福特 的 汽车 生产 流水 线 是 世界 上 最 早 的 
流水 线 之 一 ， 若 想 了 解 该 流水 线 和 生产 过 程 ， 请 阅读 文献 [2]. 


习题 

23.1 延迟 和 香 吐 率 ，I。 假 设 一 个 模块 的 延迟 是 20 ns， 寄 存 器 延迟 teg =500 ps。 考 虑 输出 寄存 器 ， 该 
模块 的 延迟 和 吞吐 率 是 多 少 ? 

23.2 延迟 和 符 吐 率 ，I。 假 设 一 个 模块 的 延迟 是 20 ns， 寄 存 器 延迟 fs =500 ps。 考 虑 输出 寄存 器 ， 将 
该 模块 复制 5 次 ， 其 延迟 和 吞吐 率 是 多 少 ? 

23.3 ”延迟 和 吞吐 率 ，II。 假 设 一 个 模块 的 延迟 是 20 ns， 寄 存 器 延迟 fs =500 ps。 考 虑 输出 寄存 器 ， 将 
该 模块 细 分 为 5 级 流水 线 后 ， 其 延迟 和 吞吐 率 是 多 少 ? 

23.4 延迟 和 吞吐 率 ，IV。 假 设 一 个 模块 的 延迟 是 20 ns ， 寄 存 器 延迟 hes =500 ps。 考 虑 输出 寄存 器 ， 将 
该 模块 细 分 为 5 级 流水 线 后 再 重复 设置 5 个 这 样 的 流水 线 ， 此 时 延迟 和 吞吐 率 是 多 少 ? 

23.5 ÆR, ffn, L 假设 一 个 模块 占用 100 个 单位 的 面积 ， 并 具有 10 ns 的 延迟 。 流 水 线 寄 
存 器 占用 2 个 单位 的 面积 ， 且 Teg =500 ps。 改 变 流水 线 的 级 数 ， 画 出 吞吐 率 和 面积 的 关系 ， 其 中 
吞吐 率 在 y 轴 ， 面 积 在 x 轴 。 试 着 说 明 当 流 水 线 很 深 时 成 本 (面积 ) 与 效益 ER) 的 关系 。 

23.6 延迟、 吞吐 率 和 面积 ，I。 将 习题 23. 5 中 流水 线 寄存 器 所 占 面 积 改 为 20 个 单位 (保持 其 他 参数 不 
变 ) 。 比 较 这 两 个 图 ， 给 出 每 个 流水 线 “最 佳 的 ”流水 线 深度 。 

23.7 批 处 理 延 迟 。 我 们 已 经 知道 流水 线 会 产生 we 的 延迟 。 这 里 我 们 考虑 处 理 一 批 作业 所 产生 的 延迟 。 
假设 模块 的 延迟 为 20 ns, H Teg =500 ps， 按 下 面 几 种 情况 分 别 计算 完成 10 个 任务 需要 多 长 时 间 : 
(a) 不 采用 流水 线 ， 只 有 一 个 单独 的 模块 。 

(b) 将 该 模块 重复 设置 5 次 。 
(c) 将 该 模块 细 分 成 一 个 5 级 流水 线 。 
(d) 如 果 任 务 数 为 1000， 重 新 计算 在 (a). (b) 和 (ce) 三 种 情况 下 各 需要 多 少时 间 。 

23.8 延迟 和 吞吐 率 的 设计 。 设 计 一 个 高 清 多 媒体 芯片 ， 要 求 该 芯片 能 够 对 1920 x 1080 像素 的 图 像 进 行 泻 
染 ， 频 率 为 60 Hz。 将 模块 设计 成 一 个 单独 的 模块 ， 该 模块 处 理 一 个 像素 需要 10 us，7,。 为 500 ps. 
(a) 所 需 吞 吐 率 是 多 少 ? 单位 为 像素 每 秒 。 

(b) 你 能 否 将 其 设计 成 一 个 长 的 流水 线 ， 且 仍 满足 所 需 吞 吐 率 ?如 果 可 以 , 需要 多 少 个 功能 段 ? 
如 果 不 可 以 ， 请 说 明 原因 。 

(c) 为 什么 采用 单一 的 流水 线 并 不 是 一 个 好 的 想法 ? 

(d) 如 果 采 用 重复 设置 处 理 模 块 的 方式 设计 流水 线 ， 需 要 设置 多 少 个 ? 

(e) 为 什么 重复 设置 处 理 模块 的 方式 不 好 ? 

(f) 与 逻辑 设计 者 沟通 后 ， 决 定 采 用 重复 设置 多 个 10 级 流水 线 的 方法 。 需 要 重复 设置 多 少 个 ? 

23.9 流水 线 加 法 器 。 用 下 列 方法 分 别 实现 第 23.3 节 中 的 32 位 加 法 器 ， 请 给 出 每 种 方法 对 应 的 延迟 时 
闻 、 香 吐 率 、 时 钟 以 及 用 到 的 触发 器 个 数 ， 其 中 Ty, = 100 ps (一 位 加 法 器 的 延迟 )， teg =200 ps. 
(a) 分 成 4 段 ， 每 段 8 位 。 
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(b) 分 成 两 段 ， 每 段 16 位 。 

(e) 分 成 32 Be, 每 段 1 位 。 

数据 转发 。 图 23-7 中 的 流水 线 加 法 器 在 完成 整个 加 法 前 (4 个 周期 )， 禁止 使 用 a +5。 修 改 这 个 
加 法 器 ， 使 它 在 开始 计算 ay + bo 后 的 那个 周期 ， 能 够 执行 a1 + (ao + bo)。 这 里 需要 添加 一 个 
dataFwd 信号 ， 用 来 指示 转发 状态 。 除 了 需要 添加 的 最 小 逻辑 电路 外 ， 加 法 器 的 吞吐 率 和 延迟 应 
保持 不 变 。 

预测 ， 单 个 缓冲 区 。 第 22. 6. 2 节 中 我 们 简要 地 讨论 了 预测 ， 即 下 级 功能 段 能 够 触发 所 有 上 级 功 
能 段 丢 弃 当 前 的 任务 。 在 图 23-9 和 图 23-10 的 Verilog 代码 中 添加 一 个 fail 信号 。 当 该 信号 发 出 
时 ,所 有 上 级 功能 段 中 的 数据 无 效 。 

预测 ， 双 缓冲 区 。 与 习题 23. 11 KW, ER 23-11 和 图 23-12 的 Verilog 代码 中 添加 一 个 fail 信号 。 
fail 信号 每 个 周期 只 能 传送 一 个 功能 段 (sj ready 信号 一 样 ) 。 

关键 路 径 上 的 停顿 。 在 一 个 8 级 流水 线 中 ,假定 每 个 逻辑 块 的 延迟 为 5 ns, teg =0。 每 个 逻辑 块 
的 停顿 信号 在 4 ns 后 稳定 。 一 个 功能 段 从 开始 到 结束 ， 导 线 延 迟 为 500 ps. 

(a) 不 采用 双 缓 冲 结构 ， 允 许 的 最 大 时 钟 是 多 少 ? 

(b) 采用 双 缓 冲 结构 ， 人 允许 的 最 大 时 钟 是 多 少 ? 

负载 均衡 ， 瓶 颈 检测 。 假 设 有 一 个 系统 ， 每 个 任务 通过 流水 线 的 4 个 功能 段 花费 的 时 间 分 别 为 
30 ns, 60 ns, 15 ns 和 20 ns。 哪 一 个 功能 段 是 瓶颈 段 ?y 每 个 功能 段 的 使 用 率 〈《 有 用 的 工作 时 间 除 
以 总 时 间 ) 是 多 少 ? 

负载 均衡 ， 重 复 设置 功能 段 。 假 设 有 一 个 系统 ， 每 个 任务 通过 流水 线 的 4 个 功能 段 花费 的 时 间 分 
别 为 30 ns. 60 ns, 15 ns 和 20 ns。 每 个 功能 段 不 能 被 进一步 拆 分 成 流水 线 ， 但 可 以 重复 设置 。 为 
了 充分 利用 整个 系统 ， 每 个 模块 各 需要 多 少 个 ? 〈 经 过 流水 线 的 建立 阶段 ， 没 有 一 个 模块 处 于 空 
闲 状 态 。) 

负载 均衡 ， 流 水 线 。 假 设 有 一 个 系统 ， 每 个 任务 通过 流水 线 的 4 个 功能 段 花 费 的 时 间 分 别 为 
30 ns, 60 ns, 15 ns 和 20 ns。 每 个 功能 段 无 法 复制 ， 但 可 以 细 分 成 流水 线 。 如 果 自 始 至 终 流水 线 
中 不 会 产生 负载 不 均 ， 可 划分 的 最 少 功能 段 数 是 多 少 ? 

瓶颈 段 复制 ， 控 制 。 在 图 23-14 中 ,我们 复制 了 4 个 瓶颈 段 ， 并 保持 时 钟 频 率 为 4 ns。 这 要 求 功 
能 段 在 每 个 时 钟 周期 花费 1 ns 产生 4 个 结果 。 在 本 习题 中 ， 要 求 设计 瓶颈 段 的 输入 和 输出 控制 逻 
辑 且 时 钟 周期 为 1 ns。 要 求实 现在 4 ns 的 时 间 里 交替 使 用 4 个 瓶颈 段 (周期 1 送 至 模块 1， 周 期 
2 送 至 模块 2， 依 次 类 推 ) 。 在 这 些 重复 模块 的 输出 部 分 ， 已 完成 模块 的 数据 应 馈送 到 最 后 一 个 功 
能 段 前 的 流水 线 寄存 器 中 。 

资源 共享 。 在 一 个 系统 中 复制 4 个 流水 线 。 流 水 线 中 功能 段 访 问 共享 资源 的 概率 是 50% ( 随 
机 )。 如 果 共 享 资源 的 数量 为 n， 计算 共 享 资源 的 利用 情况 和 一 个 周期 内 发 出 超过 个 请 求 的 
概率 : 


(e) n=4, 

TR AR. MAA 23-15a 中 的 流水 线 ， 缓冲 区 队列 深度 为 3。 如 果 B 段 的 延迟 按 以 下 序列 分 布 ， 
完成 计算 需要 多 长 时 间 。 假 设 3 个 缓冲 器 最 初 都 是 空 的 。 如 果 你 认为 流水 线 中 会 出 现 停顿 ， 请 按 
照 图 23-15b 所 示 绘 制 状态 图 。 

(a) 15. 5. 15, $S, YS. 8. 15. 5. 35; 55 

(b) 15., 15, 15. 15, 5, S. S, 5, S, 5: 


oe) 15. 15), S; 5. S, S, 5, 15, 15, 15, 


502 
1 


503 


第 24 章 | 


Digital Design: A Systems Approach 


H 连 





模块 之 间 的 互 连 是 系统 中 一 个 重要 的 组 件 ， 它 对 系统 性 能 的 影响 不 亚 于 模块 本 身 。 正 如 第 
5.6 节 中 所 述 ， 在 一 个 典型 系统 中 ， 导 线 所 产生 的 延迟 和 功 耗 往往 占有 很 大 的 比例 。 一 个 长 度 
仅 有 3 km 的 导线 所 产生 的 寄生 电容 与 最 小 的 反 相 融 相同 〈 因 此 消耗 的 功率 也 相同 ) 。 一 个 长 
度 约 100 pum 的 导线 所 消耗 的 功率 与 一 个 一 位 快速 加 法 器 消耗 的 功率 相同 。 

在 简单 系统 中 ， 模 块 之 间 可 以 直接 用 点 对 点 的 方式 相连 ， 但 对 于 更 大 、 更 复杂 的 系统 最 好 
采用 总 线 或 网 络 。 例 如 ， 有 一 个 类 似 电话 或 对 讲 的 系统 ， 如 果 只 需要 跟 两 三 个 人 通话 ， 每 个 人 
之 间 都 可 以 采用 直接 相连 的 方式 。 但 是 ， 当 通话 的 人 数 达 到 几 百 个 时 ， 就 需要 使 用 交换 系统 
了 ， 这 样 通过 一 个 共享 的 互连网 络 就 可 以 实现 任何 人 之 间 的 通话 。 


24.1 互 连 简 述 


图 24-1 是 某 个 系统 的 总 体 框图 ， 该 系统 采用 的 是 通用 互 连 结 构 ( 如 一 个 总 线 或 者 一 个 网 
络 ) 。 若 干 个 客户 端 通过 一 对 往返 导线 与 网 络 相连 。 这 些 连 接 可 以 采用 串 行 方式 ( 见 22.3 节 )， 
且 连 入 互 连 时 需要 进行 流 控制 ， 以 便 产生 竞争 事件 时 使 用 背 压 技术 。 

通信 时 客户 端 $ ( 源 端 ) 经 链 路 i 将 数据 包 发 送 
到 互连网 络 上 。 该 数据 包 至 少 包 括 : 目的 地 址 D 和 
有 效 载荷 P， 该 有 效 载荷 可 以 是 任意 长 度 (或 者 可 变 
长 度 ) 。 互 连 网 络 通过 ou 将 P 发 送 给 客户 端 D， 由 于 
竞争 ， 互 连 网 络 可 能 会 有 一 些 延 迟 。 有 效 载 荷 P 可 


以 包含 请 求 类 型 (如 读 或 写 ) 、D 的 本 地 地 址 、 数 据 see ei 
或 其 他 用 于 远程 操作 的 参数 。 由 于 互 连 时 采用 了 纺 


址 ， 只 要 每 个 客户 端 模块 有 一 对 单 向 连接 ， 任何 客 图 24-1 一 个 为 若干 客户 端 提供 任意 连接 





户 端 之 间 就 可 以 实现 通信 。 的 抽象 互连网 络 。 接 人 互连网 络 
S 向 DD 发 送 一 个 数据 包 (D，P) ， 可 能 会 导致 D 的 每 个 链接 均 采 用 流 控制 ， 传 输 


向 S 发 送 一 个 有 效 载荷 为 Q 的 应 答 报 文 (S，Q), 但 的 数据 包 中 包含 一 个 目的 地 址 
应 答 报 文 不 是 必须 发 送 的 ， 因 此 通信 可 以 是 单 向 的 。 

互 连 可 以 允许 也 可 以 禁止 多 个 并 行 操 作 。 为 了 获得 高 吞吐 率 ， 我 们 希望 在 互 连 时 允许 多 个 
独立 的 客户 端 同 时 通信 。 同 样 ， 如 果 需 要 接收 应 答 包 ， 我 们 也 和 希望 客户 端 S 在 等 待 应 答 前 能 将 
多 个 数据 包 发 送 到 同一 个 或 不 同 的 目的 客户 端 。 但 是 ， 如 果 使 用 的 互 连 成 本 较 低 ， 如 采用 第 
24. 2 节 中 的 总 线 ， 就 无 法 支持 这 种 并 发 操作 。 


24.2 总 线 


广播 总 线 是 一 种 最 简单 的 通用 互 连 结构 ， 广 泛 应 用 于 性 能 要 求 不 高 的 场合 。 总 线 具 有 简 
单 、 便 于 广播 及 所 有 事务 能 够 序列 化 (有 序 ) 的 优势 。 由 于 总 线 一 次 只 允许 发 送 一 个 数据 包 ， 
因此 性 能 不 高 。 

图 24-2 是 一 个 典型 的 总 线 互 连 结 构 。 每 个 模块 通过 接口 与 总 线 相连 ,该 接口 可 将 模块 的 
ready-valid 流 控制 信号 转换 后 提供 给 总 线 仲裁 。 除 了 ready 和 valid 信号 外 ， 模 块 与 接口 相连 时 
还 需要 提供 地 址 信号 和 数据 信号 。 
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图 24-2 ”总线 互 连 。 模 块 通过 接口 连接 到 总 线 。 源 模块 访问 总 线 需要 先 赢得 仲裁 ， 然 后 再 
将 数据 包 发 送 到 总 线 。 所 有 目的 端 接口 监视 总 线 上 的 地 址 信息 ， 如 果 发 现 地 址 与 
其 匹配 ， 将 数据 包 发 送 到 对 应 的 客户 端 


图 24-3 是 用 Verilog 实现 的 一 个 组 合 逻 辑 总 线 接口 。 图 中 使 用 了 常规 的 信号 命名 方法 ， 名 
字 的 第 一 个 字母 表示 与 接口 相连 的 那 一 端 : b 表示 总 线 ，c 表示 客户 端 。 名 字 的 第 二 个 字母 表 
示 方 向 : r 表示 输出 〈 即 总 线 接收 ) ，t 表示 输入 《〈 即 总 线 发 送 ) 。 





// AAEH W REG 
// 信号 名 中 的 t (表示 发 送 ) 和 r (表示 接收 ) 是 从 总 线 角 度 出 发 的 


module BusInt (cr valid, cr_ready, cr addr，cr data，// 总 线 rx， 发 往 总 线 


ct valid, ct data, // X Rrx, KURA 
br addr, br data, br _ valid, // 发 往 总 线 
bt addr, bt data, bt_valid, // 来 自 总 线 
arb req, arb grant, // 仲裁 信号 
my_addr) ; // 接口 地 址 


parameter aw = 2 ; // 地 址 宽度 

parameter dw = 4 ; // 数据 宽度 

input cr valid, arb grant, bt valid ; 

output cr ready, ct valid, arb req, br_valid ; 
input [aw-1:0] cr addr, bt addr, my_addr ; 
output [aw-1:0] br_addr ; 

input [dw-1:0] cr_data , bt_data ; 

output [dw-1:0] br_data, ct_data ; 

// 仲裁 


assign arb_req = cr_valid ; 
assign cr_ready = arb_grant ; 


// 总 线 驱 动 

assign br valid = arb grant ; 

assign br addr = arb grant ? cr addr : 0 ; 
assign br data = arb grant ? cr data : 0 ; 


// 总 线 接收 


assign ct valid = bt valid & (bt_addr == my_addr) ; 


assign ct data = bt data ; 
endmodule 


图 24-3 一 个 用 Verilog 代码 实现 的 组 合 逻 辑 总 线 接口 
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当 一 个 客户 端 希 望 与 总 线 上 的 其 他 模块 通信 时 ， 它 将 目标 模块 的 地 址 存 人 地 址 字段 cr _ 
addr， 将 数据 存 人 数据 字段 cr_data， 并 发 出 cr_valid 信号 。 总 线 接口 将 模块 的 有 效 信和 号 
发 送 到 中 央 总 线 仲裁 器 ( 即 arb_read=cr_valid)， 经 仲裁 器 仲裁 后 ， 向 请 求 接口 发 送 一 个 
grant 信号 (参见 第 8.5 节 ) 。 总 线 接口 将 grant 信号 作为 一 个 ready 信号 返回 给 请 求 模 块 〈 即 
cr_ready = arb_grant)， 此 外 该 信号 还 可 作为 门 控 信号 控制 模块 的 数据 和 地 址 向 总 线 
传送 。 

如 果 请 求 客 户 端 没 有 赢得 仲裁 ， 它 只 需要 发 出 cr valid 进行 等 待 ， 直 到 出 现 信号 cr_ 
ready 才能 赢得 仲裁 。 

总 线 驱 动 逻辑 对 所 有 总 线 接口 发 出 的 信号 执行 或 运算 。 当 没有 接口 被 选中 时 ， 各 接口 驱动 
为 零 。 有 时 会 在 片 外 采用 三 态 驱 动 。 由 于 片 内 三 态 总 线 存 在 很 多 问题 ( 见 第 4.3.4 节 )， 片 内 
总 线 通 常 先 对 所 有 总 线 接口 信号 执行 或 运算 ， 然 后 再 将 结果 反馈 给 所 有 的 总 线 接口 。 

在 接收 端 一 侧 ， 各 总 线 接口 监视 总 线 上 的 地 址 信息 。 当 检测 到 地 址 与 自己 匹配 且 总 线 发 出 
valid 信号 时 ， 将 总 线 上 的 数据 传送 到 目标 模块 。 总 线 的 接收 端 通常 使 用 push 流 控制 ( 即 模块 
必须 立即 接收 发 给 它们 的 数据 ) 。 在 习题 24. 1 中 ， 要 求 为 总 线 接收 方 添加 完整 的 流 控制 。 

总 线 可 以 实现 多 播 或 广播 通信 。 为 了 指定 一 个 多 播 ， 用 一 个 输出 选择 位 向 量 取 代 地 址 信 
号 ， 向 量 中 的 每 一 位 对 应 一 个 客户 端 。 要 将 数据 包 发 送 到 某 个 客户 端 ， 只 需要 设置 对 应 的 向 量 
位 。 如 果 要 将 数据 包 多 播 给 多 个 客户 端 ， 需 要 设置 多 位 ， 每 一 位 代表 一 个 目的 地 。 当 向 量 所 有 
位 都 被 设置 ， 数 据 包 会 被 广播 到 所 有 客户 端 。 如 果 流 控制 采用 的 是 push 方式 ， 很 容易 修改 代 
码 实现 多 播 ， 但 是 如 果 输 出 端 采 用 双向 流 控制 时 ， 处 理 ready 信号 时 要 仔细 。 习 题 24.4 中 , 我 
们 将 探讨 这 一 问题 。 

严格 来 说 ， 图 24-3 中 的 逻辑 电路 是 一 个 组 合 逻 辑 。 这 里 假设 所 有 客户 端 共用 一 个 时 钟 。 
每 个 时 钟 周期 结束 时 ， 当 cr_valid =cr_ready =1， 客 户 端 完 成 输出 ， 可 以 进行 下 一 次 传 
输 或 将 cr_valia 设置 成 无 效 状态 。 同 理 ， 当 时 钟 周 期 结束 时 客户 端 如 果 接 收 到 ct valid 
信号 ， 此 时 必须 接收 传 入 的 事务 。 时 钟 周期 必须 足够 长 ， 这 样 才能 保证 总 线 仲裁 和 信号 的 传播 
处 于 一 个 时 钟 周期 内 。 在 习题 24.2 中 ,我们 将 讨论 如 何 将 这 两 个 功能 设计 成 流水 线 来 提高 总 
线 的 速度 。 

图 24-3 也 是 一 种 完全 并 行 的 逻辑 ， 因 为 地 址 和 数据 是 在 一 个 周期 内 完成 传送 的 。 由 于 片 
内 资源 丰富 ， 通 常情 况 下 采用 完全 并 行 的 总 线 是 一 个 不 错 的 解决 方案 。 但 是 当 片 外 或 是 片 内 的 
数据 已 经 串 行 化 时 ， 最 好 选用 图 22-6 中 那样 的 串 行 总 线 ， 让 数据 在 几 个 周期 内 完成 事务 ， 可 
以 减少 引 脚 的 数量 或 者 可 以 避免 增加 串 并 转换 的 成 本 。 习 题 24.3 中 ， 我们 将 对 这 一 方法 进行 
讨论 。 

第 24. 1 节 中 描述 的 抽象 互 连 结 构 和 总 线 采 用 的 都 是 单 向 通信 方式 ， 即 发 送 者 向 接收 者 发 
送 一 个 数据 包 。 如 果 需 要 应 答 会 有 一 个 单独 的 数据 包 从 相反 方向 发 送 到 互连网 络 上 ， 例 如 读 
取 接 收 器 上 的 存储 地 址 。 有 时 我 们 把 这 种 将 一 个 操作 分 成 两 个 独立 的 通信 方式 的 行为 (一 个 用 
于 请 求 、 一 个 用 于 应 答 ) 称 为 分 离 事 务 。 之 前 提 到 的 一 些 总 线 是 通过 发 出 ready 信号 来 完成 应 
答 的 ， 与 之 相 比 ， 分 离 事务 可 以 免 去 一 次 应 答 。 

通常 情况 下 ， 单 独 设置 一 个 应 答 信 号 首要 考虑 的 是 速度 和 通用 性 。 首 先 ， 多 个 请 求 - u 
事务 本 身 就 很 慢 ， 而 且 接 收 方 在 等 竺 回复 的 过 程 中 始终 持 有 总 线 。 例 如 ， 读 取 存 储 器 时 ， 有 可 
能 需要 花费 100 ns (100 个 1 GHz 的 时 钟 周期 ) 的 时 间 。 在 这 期 间 ， 接 收 方 持 有 总 线 并 处 于 空 
闲 状 态 ， 会 浪费 宝贵 的 通信 资源 。 其 次 ， 该 传输 方式 难以 像 网 络 这 种 多 级 互 连 结构 (第 24.4 
节 ) 那样 处 理 多 个 事务 。 因 此 ， 一 个 客户 端 如 果 采 用 这 种 类 型 的 互 连 结构 ， 其 性 能 将 会 受到 
限制 。 
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24.3 ”交叉 开关 

当 总 线 无 法 满足 性 能 要 求 ， 且 客户 端的 数量 很 少时 (通常 不 超过 16 个 ) ， 采 用 交叉 开关 是 
一 个 很 好 的 解决 方案 。 图 24-4 中 用 到 的 就 是 交叉 开关 ， 其 中 有 mn 个 发 送 端 ，n 个 接收 端 。 通 
常情 况 下 m =n， 每 个 客户 端 既 是 发 送 方 又 是 接收 方 。 图 中 每 一 行 的 信号 中 包括 数据 信号 、 发 
送 用 的 valid 信号 和 接收 用 的 ready 信和 号。 发送 客户 端 通过 地 址 选择 接收 数据 的 客户 端 。 





图 24-4 交叉 开关 可 以 将 不 用 的 输入 端 与 输出 端 连接 起 来 ， 并 支持 多 种 并 发 连接 


当 发 送 客户 端 i 希望 与 接收 客户 端 j 通信 时 ， 发 送 客 户 端 i 将 j 作 为 地 址 信号 ， 将 通信 数据 
作为 数据 信号 ， 并 发 出 数据 有 效 信号 。 分 配器 对 所 有 的 连接 请 求 进行 综合 考虑 后 ， 产 生 一 组 不 
冲突 的 授权 和 矩阵 ( 即 一 个 m xn 的 二 进 制 信号 ， 可 控制 各 交叉 点 开关 ) 。 如 果 人 允许 客户 端 i 向 客 
户 端 j 发 送 数据 包 ， 分 配器 发 出 g;,， 第 i 行 第 j 列 的 交叉 开关 打开 。 此 时 数据 信号 连通 ，valid 
信号 从 第 i 行 连接 到 第 j 列 ，ready 信号 从 第 j 列 连接 到 第 i 行 。 

分 配器 需要 仔细 考虑 如 何 处 理 这 m x n 个 连接 请 求 ， 然 后 会 生成 一 个 m x n 的 无 冲突 访问 
授权 和 矩阵。 为 了 不 产生 冲突 ， 该 矩阵 的 每 行 和 每 列 最 多 只 能 有 一 个 为 1。 当 一 个 输入 只 能 指定 
一 个 输出 时 〈 根 据 地 址 信号 ) ， 请 求 矩 阵 每 一 行 上 最 多 只 有 一 个 为 1， 分 配器 仲裁 的 请 求 将 减 
少 到 nn， 即 每 列 只 有 一 个 。 

多 数 情 况 下 ， 每 个 发 送 客户 端 可 以 将 多 个 数据 包 发 送 到 多 个 不 同 的 目的 地 〈 一 个 数据 包 对 
应 一 个 ) 。 此 时 ， 请 求 矩 阵 的 一 行 上 可 能 会 有 多 个 1， 分 配器 必须 能 解决 二 分 图 匹配 问题 。 文 
献 [ 33 ] 对 这 种 通用 分 配器 做 了 详细 的 描述 。 

图 24-5 用 Verilog 代码 实现 了 一 个 2 x2 的 交叉 开关 ， 输 入 和 输出 均 使 用 ready-valid 流 控 
制 。 在 该 例 中 ， 客 户 端 0 的 优先 级 最 高 。 这 有 段 代码 中 的 授权 矩阵 是 根据 请 求 矩 阵 生 成 的 ， 如 
果 希 望 有 一 种 更 公平 的 仲裁 方式 ， 读 者 可 自行 修改 代码 。 当 授权 和 矩阵 生成 后 ， 该 矩阵 就 可 
以 使 能 相应 的 正 向 连接 (BN valid 信号 和 数据 ) 和 反 向 连接 (ready 信和 号)。 一 旦 寻 址 和 仲裁 
完成 ,交叉 开关 就 将 源 客户 端 和 目的 客户 端 之 间 用 于 流 控 制 接口 的 ready, valid 信号 和 数据 
线 连 接 起 来 。 

可 以 像 总 线 一 样 先 执行 仲裁 任务 ， 一 个 周期 后 再 进行 数据 通信 ， 这 样 交叉 开关 就 可 以 实现 
流水 线 工 作 。 如 果 需 要 ， 可 以 在 每 个 交叉 点 上 设置 一 个 流水 线 寄存 器 ， 这 样 开关 在 水 平方 向 的 
通信 也 可 以 与 仲裁 并 行 完 成 。 垂 直方 向 的 通信 和 则 安排 在 下 一 个 周期 进行 。 习 题 24. 10 中 将 讨论 
这 种 组 成 结构 。 
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| // 2x2 交 叉 开关 一 一 全 流 控 抽 
module Xbar22(cOr_valid, cOr_ready, cOr_addr, c0r data, // 客户 端 0 
cOt_valid, cOt_ready, cOt_data, 
clr_valid, clr_ready, clr_addr, clr_data, // 客户 端 1 
clt_valid, clt_ready, cit data) ; 
parameter dw = 4 ; // 数据 宽度 
input cOr valid, cOt_ready, clr_valid, clt_ready ; // valid/ready f 
output cOr_ready, cOt_valid, clr_ready, cit_valid ; 
input cOr_addr, clr_addr ; // 地 址 
input [dw-1:0] cOr_data, clr_data ; // 数据 
output [dw-1:0] cOt_data, clt_data ; 


// 请 求 矩阵 

wire req00 = (cOr_addr == 0) & cOr_valid ; 
wire req01 = (cOr_addr == 1) & cOr_ valid ; 
wire reqlO = (clr_addr == 0) & clr valid ; 
wire reqll = (clr_addr == 1) & clr_valid ; 


// 客户 端 0 赢得 仲裁 
wire grant00 = req00 ; 
wire grant01 = req01 ; 





wire grant10 = reql0 & “req00 ; 
wire grantil = reqll & “req0l1 ; 





// 连接 
assign cot valid = (grant00 & cOr_valid) | (grant10 & clr valid) ; 
assign cot_ data = ({dw{grant00}} & cor data) | 

({dw{granti0}} & cir data) ; 
assign clt_valid = (grant01 & cOr_valid) | (grant11 & clr_valid) ; 
assign clt_data = ({dw{grant01}} & cOr_data) | 

({dw{grant11}} & clr data) ; 
// BH 
assign cOr_ready = (grant00 & cOt_ready) | (grant01 & clt_ready) ; 
assign clr_ready = (grantl10 & cOt_ready) | (grantll & clt_ready) ; 

| endmodule 








图 24-5 ”一 个 具有 全 流 控制 的 2 x2 交叉 开关 


和 总 线 一 样 ， 交 叉 开 关 可 以 实现 多 播 也 可 以 处 理 串 行 接口 。 习 题 24. 8 和 习题 24.9 中 ,我 
们 将 讨论 这 些 情况 。 

在 交叉 开关 上 为 整个 数据 包 设 置 缓冲 ， 可 以 提高 开关 的 吞吐 率 。 增 加 缓冲 后 可 以 减少 输入 
和 输出 调度 。 输 入 端 将 发 往 多 个 输出 端的 数据 包公 加 到 所 在 行 的 不 同 交 叉 点 上 。 这 些 数 据 包 则 
与 所 在 列 上 的 其 他 数据 包 争夺 输出 端的 访问 权限 。 


24.4 互连网 络 
当 客户 端 数量 超过 16 个 时 ， 模 块 之 间 通 常 需要 使 用 互连网 络 进行 通信 。 互 连 网 络 由 一 组 
连接 多 个 通道 的 路 由 器 组 成 ， 甚 特征 是 具有 一 定 的 拓扑 结构 、 路 由 算法 和 特定 的 流 控制 方法 。 
网 络 拓扑 结构 规定 了 一 组 路 由 器 、 多 条 通道 以 及 它们 之 间 是 如 何 连接 的 。 例 如 ， 图 24-6 
是 一 个 互连网 络 ， 其 中 18 个 客户 端 通过 一 个 3 x3 的 二 维 网 状 拓扑 相连 ， 每 个 路 由 器 连接 两 个 
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客户 端 。 该 网 络 共 有 9 个 路 由 器 ， 每 个 路 由 器 多 达 6 个 双向 端口 和 12 AAL A h 68 
相 邻 连接 在 一 个 3 x3 的 网 格 上 。 


02 12 22 
6 7 
01 
客户 端 | | 客户 端 
0 1 


00 


图 24-6 用 路 由 器 和 通道 将 客户 端 连 在 一 起 的 互连网 络 







路 由 算法 用 来 确定 源 客户 端 到 达 目 的 客户 端的 网 络 路 径 。 图 24-6 中 的 网 络 可 以 采用 维 序 
路 由 算法 ,该 算法 基本 核心 是 数据 包 先 在 x 方向 上 被 路 由 到 目标 列 ， 然 后 在 y 方 向 被 路 由 到 目 
标 行 ， 最 终 到 达 目 的 客户 端 端口 。 

这 里 我 们 简单 分 析 一 下 客户 端 0 到 客户 端 11 的 路 由 。 客 户 端 0 将 数据 包 (利用 第 24.1 市 
中 提 到 的 接口 ) 送 入 路 由 器 00, 该 包 首 先 在 x 方向 上 被 路 由 到 路 由 器 20。 这 条 路 径 包 括 x 通 
道 cx00、cx10， 以 及 中 间 路 由 器 10。 接 下 来 ,数据 包 在 y 方 向 上 经 过 y 通道 cy20 到 达 路 由 器 
21。 最 后 ， 数 据 包 被 送 到 客户 端 11 与 路 由 器 21 相连 的 端口 上 。 

与 接口 的 流 控制 方式 不 同 ， 互 连 网 络 的 流 控制 是 要 为 网 络 上 传输 的 数据 包 分 配 资源 。 典 型 
的 网 络 资源 是 通道 和 缓冲 区 。 每 个 资源 在 一 定 的 时 间 内 分 配 一 个 特定 的 数据 包 ， 之 后 可 以 自由 
分 配 不 同 的 数据 包 。 

图 24-7 是 互连网 络 流 控制 的 一 个 实例 ， 图 中 给 出 了 按 维 序 路 由 算法 将 一 个 数据 包 从 客户 
端 0 发 送 到 客户 端 11 所 做 的 资源 分 配 。 该 图 水 平 轴 表 示 时 间 ， 垂 直 轴 为 分 配 的 资源 。 在 没有 
竞争 的 情况 下 ， 数 据 包 每 个 时 钟 周期 前 进一步 。 周 期 0 时 数据 包 通过 客户 端 0 的 输出 端口 ， 周 
期 1 时 进入 路 由 器 00 的 内 部 ， 周 期 2 时 经 过 通路 cx00e (通道 cx00 的 东 侧 ) 。 数 据 包 到 达 路 由 
器 10 时 ，cxl0e 还 不 可 以 使 用 ， 数 据 包 需 要 在 这 里 缓存 两 个 周期 。 同 样 ， 数 据 包 在 路 由 融 20 
中 需要 缓存 一 个 周期 。 最 终 在 周期 11 ， 数 据 包 被 传送 到 客户 端 11。 
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图 24-7 一 个 数据 包 流 从 客户 端 0 到 客户 端 11 的 时 空 图 分 布 。 该 数据 包 在 路 由 器 10 中 被 阻 

塞 延迟 了 2 个 周期 ， 在 路 由 器 20 中 被 阻塞 延迟 了 1 个 周期 


路 由 器 中 的 缓冲 区 及 通道 的 带宽 由 流 控 制 协议 分 配 。 在 网 络 中 使 用 缓冲 技术 可 以 减少 资源 
分 配 的 时 间 。 没 有 缓冲 就 无 法 实现 数据 包 在 周期 2 时 经 cx00e 到 达 路 由 器 10 ， 在 周期 6 时 又 经 
cxl0e 离开 。 期 间 产生 延迟 的 是 因为 周期 4 和 周期 5 时 出 现 阻塞 ， 数 据 包 被 保留 在 缓冲 区 内 。 
如 果 没 有 缓冲 ， 数 据 包 在 周期 4 时 要 么 离开 要 么 被 丢弃 。 

互连网 络 中 的 拓扑 结构 、 路 由 和 流 控制 三 者 之 间 的 关系 与 公路 上 驾驶 汽车 非常 相似 。 拓 扑 
结构 就 是 地 图 ， 通 道 就 是 各 条 道路 ， 而 路 由 器 就 是 交叉 路 口 。 路 由 算法 就 是 驾驶 员 如 何 选 择 路 
线 。 当 给 出 当前 位 置 和 目的 地 后 ， 驾 驶 员 会 选择 一 条 路 线 到 达 目 的 地 ， 途 中 要 经 过 某 些 道路 和 
交叉 路 口 。 流 控制 可 以 看 作 道 路 上 的 交通 灯 ， 它 为 驾驶 员 分 配 下 一 段 道路 的 使 用 权 。 通 向 交叉 
路 口 的 道路 可 以 看 作 一 个 缓冲 区 ， 在 交通 灯 将 下 一 条 道路 的 使 用 权 分 配给 驾驶 员 之 前 ， 车 暂时 
要 停 在 那里 。 

到 目前 为 止 ， 我 们 假定 整个 数据 包 是 在 一 个 时 钟 周 期 内 并 行 传输 的 。 与 之 前 已 讨论 过 的 其 
他 互 连 结构 一 样 ， 也 可 以 采用 一 个 位 宽 较 窗 的 接口 ， 让 数据 包 在 几 个 周期 内 完成 传输 ， 这 样 互 
连 网 络 也 可 以 实现 串 行 传输 。 基 于 这 种 串 行 网 络 ， 可 以 在 整个 数据 包 上 实现 流 控制 (在 这 种 情 
况 下 ， 路 由 器 必须 有 足够 大 的 缓冲 区 来 容纳 整个 数据 包 ) ， 也 可 以 在 数字 级 或 微 片 级 (通常 是 
指 一 个 时 钟 周期 传送 的 信息 量 ) 上 实现 流 控 制 。 数 据 包 级 的 流 控制 类 似 于 图 22-6 所 示 的 帧 级 
流 控 制 ， 而 微 片 级 流 控 制 类 似 于 一 个 普通 的 ready-valid 接口 。 

本 书 无 法 涵盖 互连网 络 中 的 所 有 内 容 。 如 果 设计 不 当 ， 路 由 或 更 高 级 别 的 交互 协议 会 造成 
网 络 死 锁 。 消 除 死 锁 以 及 常见 的 隔离 流量 的 方法 是 采用 一 种 独特 的 缓冲 区 分 配方 式 ， 该 方式 可 
以 将 网 络 中 的 一 个 物理 通道 呈现 为 多 个 虚拟 通道 。 要 想 了 解 这 些 概念 和 其 他 一 些 议题 ， 请 查阅 
参考 文献 [33]. 


小 结 

模块 之 间 的 互 连 是 大 多 数 数字 系统 中 的 一 个 重要 部 件 。 当 模块 数 较 多 时 ， 交 换 互 连 ， 如 总 
线 或 网 络 ， 可 以 为 通信 模块 提供 专用 的 点 对 点 链接 。 就 像 在 电话 交换 机 系统 中 ， 交 换 互 连 可 以 
使 任何 一 个 客户 端 模块 通过 一 对 链接 (每 个 方向 只 有 一 条 ) 与 其 他 模块 通信 。 

总 线 是 一 种 最 简单 的 交换 互 连 。 在 总 线 系统 中 ， 客 户 端 需要 经 过 仲裁 才能 访问 总 线 。 赢 得 
仲裁 的 客户 端 将 数据 和 目的 地 址 发 送 到 总 线 。 接 收 模块 识别 出 自己 的 地 址 信息 后 ， 读 取 总 线 上 
的 数据 。 总 线 的 优势 是 简单 ， 能 为 所 有 通信 排序 并 具有 广播 的 功能 。 但 是 ， 由 于 同一 时 间 只 能 
有 一 个 客户 端 传送 数据 ， 总 线性 能 受到 了 限制 。 


#2432 Z #4 377 





当 客户 端 数 较 少 且 需 要 比 总 线性 能 更 高 的 互 连 结构 时 ， 可 以 采用 交叉 开关 。 只 要 不 发 生 冲 
突 ， 交 叉 开 关 人 允许 多 个 通信 并 发 工作 。 

当 需 要 连接 更 多 的 客户 端 时 ， 通 常 使 用 互连网 络 。 互 连 网 络 由 一 组 连接 多 个 通道 的 路 由 器 
组 成 。 路 由 器 和 通道 的 连接 称 为 网 络 的 拓扑 结构 。 根 据 路 由 算法 ,选取 相应 的 路 由 器 和 通道 形 
成 一 条 路 径 。 通 过 该 路 径 将 数据 包 从 源 转发 到 目的 地 。 这 条 路 径 上 的 资源 分 配 可 采用 一 种 流 控 
制 方式 。 


文献 说 明 


为 了 全 面 了 解 互连网 络 ， 请 查阅 Dally 所 著 文献 [31] 和 [33]。 有 关 最 新 的 商业 处 理 器 
IBM Cell 总 线 的 概述 ， 请 查阅 参考 文献 【63] 。 


习题 

24.1 带 流 控制 的 总 线 接收 器 。 图 24-3 中 总 线 的 输出 端 采 用 ready-valid 流 控制 方式 (cr -xxx 信号 )， 
输入 端 采用 的 是 单 向 push 流 控制 方式 〈ct - xxx 信号 ) 。 修 改 接口 ， 使 输入 端 也 采用 ready-valid 
流 控 制 方式 。( 提示 : 在 客户 端 一 侧 的 接口 中 增加 ct ready 信号 ， 在 总 线 一 侧 增加 bt ready 
和 br_ready 信号。) 

24.2 流水 线 总 线 仲裁 。 为 提高 速度 ， 图 24-3 中 的 总 线 可 以 采用 流水 线 方式 工作 ， 将 仲裁 提前 总 线 传输 
一 个 周期 。 画 出 框图 并 用 Verilog 编写 (和 测试 ) 按 这 种 方式 仲裁 的 总 线 接口 。 接 口 信号 要 求 与 图 
24-3 中 的 完全 一 致 。 通 过 该 总 线 接口 ， 模 块 能 够 实现 背 对 背 传 输 。 (提示 : 要 实现 背 对 背 传输 ， 
模块 必须 在 内 部 缓存 一 个 传输 事务 (地址 和 数据 ) ， 同 时 对 下 一 个 事务 进行 仲裁 。) 

24.3 串 行 总 线 。 修 改 图 24-3 中 的 总 线 接口 ， 使 其 能 够 按照 图 22-6 中 那样 执行 串 行 传输 。 假 设 总 线 宽度 
为 4 位 ， 可 以 用 来 传输 地 址 信息 和 数据 信息 。 假 设 地 址 宽度 是 4 位， 数据 宽度 是 20 位 (包括 4 位 
控制 信号 和 16 位 有 效 数 据 ) 。 要 求 首 先 发 送 地 址 信息 。 假 定 传输 为 帧 级 传输 ， 源 端 采 用 双向 流 控 
制 方式 ， 目 的 端 采用 单 向 push 流 控制 方式 。 

24.4 具有 全 流 控 制 的 多 播 总 线 。 修 改 图 24-3 的 Verilog 代码 ， 使 其 在 接收 端 采用 全 流 控制 方式 处 理 多 播 
(如 习题 24. 1 ) 。 假 设 cr_addr 替换 为 cr_vector， 位 向 量 可 以 指定 多 个 目标 客户 端 。 (Hm: 
所 有 选 定 的 输出 没有 发 出 ct_ready 前 ， 不 能 发 出 bt_valide。) 

24.5 菊花 链 总 线 仲裁 。 设 计 并 编写 菊花 链 总 线 的 控制 器 和 仲裁 器 。 菊 花 链 总 线 没有 集中 的 仲裁 器 ， 而 
是 在 本 地 由 每 个 控制 器 做 出 请 求 / 授 权 决 定 。 控 制 器 0 优先 级 最 高 ， 如 果 该 控制 器 有 请 求 ， 可 直接 
把 数据 发 送 到 总 线 上 。 只 有 当 控 制 器 0 没有 请 求 时 ， 控 制 器 1 才能 授权 访问 总 线 ， 以 此 类 推 。 只 
有 下 游 Y -1 个 控制 器 没有 请 求 时 ， 控 制 器 N 才能 使 用 总 线 。 

24.6 分布 式 总 线 仲 裁 。 编 写 一 个 控制 器 实现 分 布 式 总 线 仲 裁 。 在 每 一 轮 仲裁 期 间 (多 个 时 钟 周期 )， 
每 个 发 出 请 求 的 控制 器 将 自己 优先 级 发 送 到 总 线 上 ， 该 总 线 上 所 有 信和 号 通过 或 运算 连 在 一 起 。 在 
第 一 轮 中 ， 如 果 MSB 位 的 优先 权 大 于 某 个 控制 器 ， 该 控制 器 将 失去 仲裁 。 然 后 对 MSB - 1 位 及 所 
有 剩余 位 ， 反 复 执行 这 一 过 程 。 当 仲裁 结束 时 ， 只 有 一 个 控制 器 获得 总 线 的 使 用 权 。 

24.7 4x4 的 交叉 开关 。 编 写 Verilog 代码 ， 实 现 一 个 具有 全 流 控 制 的 4 x4 交叉 开关 。 输 入 和 输出 信号 
与 图 24-5 相同 ， 但 是 控制 器 要 求 两 个 以 上 。 

24.8 多 播 交 又 开 关 。 设 计 一 个 支持 多 播 的 4 x4 交叉 开关 。 每 个 输入 端 可 以 申请 将 数据 发 送 到 一 个 或 多 
个 输出 端 ， 但 仲裁 结果 必须 是 全 发 或 全 不 发 。 即 输入 端 获得 授权 将 数据 发 送 到 所 有 输出 端 或 者 一 
个 都 不 发 。 

24.9 串 行 交 又 开关 。 修 改 图 24-5 中 的 2 x2 交叉 开关 ， 使 其 能 够 实现 20 位 有 效 数据 的 串 行 传输 。 交 又 
线 宽度 只 有 4 位 ， 只 能 对 每 个 数据 包 包头 执行 一 次 仲裁 和 流 控制 。 

24.10 带 缓冲 的 交叉 开关 。 设 计 一 个 交叉 点 数 为 到 的 交叉 开关 ， 要 求 各 交叉 点 具有 缓冲 功能 。 在 每 个 

周期 内 ， 每 个 输入 数据 被 写 人 所 需 的 输出 缓冲 区 内 (该 缓冲 区 未 满 ) 。 输 出 通道 对 发 出 请 求 的 输 
人 交叉 点 仲裁 后 ， 弹 出 其 中 一 个 ， 将 数据 输出 。 
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24.11 用 Verilog 实现 一 个 简单 的 路 由 器 。 用 Verilog 编写 一 个 类 似 图 24-6 中 那样 用 于 网 状 结构 的 简单 路 


由 器 。 路 由 器 要 求 提 供 一 个 与 客户 端 相 连 的 端口 ， 该 端口 在 两 个 方向 上 均 采 用 ready - valid 流 控 
制 方式 ， 且 在 4 个 方向 〈 西 ， 东 , dk, Pj) 各 有 一 个 采用 ready-valid 流 控 制 的 通道 端口 。 路 由 器 
需要 为 5 个 输入 提供 双 缓 冲 〈 第 23. 5 节 ) ， 以 便 下 一 个 通道 不 立即 使 用 数据 包 时 可 以 先 缓冲 ， 而 
不 需要 与 之 前 的 路 由 器 再 建立 专门 的 路 径 。 假 设 整个 路 线 被 编码 并 存 人 数据 包 中 的 地 址 字段 ， 每 
一 跳 用 3 位 来 指定 所 跳 端 口 。 路 由 器 应 该 使 用 最 高 3 位 来 表示 这 个 字段 ， 地 址 字段 向 左 移动 3 位 
后 ， 下 一 个 路 由 器 的 路 由 信息 正好 存放 在 这 里 。 
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存储 器 的 用 途 广泛 ， 在 数字 系统 中 得 到 大 量 使 用 。 在 处 理 器 系统 中 ，SDDR DRAM 芯片 用 
于 主 存 ，SRAM 阵列 用 于 高 速 缓存 、 块 表 、 分 支 预测 表 以 及 其 他 内 部 存储 。 在 互联 网 的 路 由 器 
(图 23-3b) 中 ,存储 器 用 于 数据 包 的 缓冲 、 路 由 表 、 数 据 流 存储 及 统计 数据 收集 等 功能 上 。 
在 手机 的 系统 级 芯片 中 ， 存 储 器 用 于 视频 流 和 音频 流 的 缓冲 。 

衡量 存储 器 的 性 能 主要 有 三 个 参数 : 容量 、 延 迟 和 吞吐 率 。 容 量 代表 了 数据 的 存储 量 ， 延 
迟 反 映 的 是 访问 数据 花费 的 时 间 ， 吞 吐 率 反映 了 在 一 个 固定 时 间 里 能 够 访问 的 次 数 。 

一 个 系统 中 的 存储 器 ， 如 一 台 路 由 器 的 数据 包 缓冲 区 ， 通 常 是 由 多 个 类 型 的 基本 存储 体 组 
成 ， 如 片上 SRAM 阵列 或 片 外 DRAM 芯片 。 一 个 存储 器 的 容量 和 吞吐 率 由 使 用 的 基本 存储 体 
数 决定 。 如 果 一 个 基本 存储 体 的 容量 不 够 实现 所 需 存 储 器 ， 就 必须 使 用 多 个 基本 存储 体 来 构建 
存储 器 ， 但 该 存储 器 在 使 用 时 同一 时 间 里 只 能 访问 其 中 的 一 个 基本 存储 体 。 同 样 ， 如 果 一 个 基 
本 存储 体 无 法 提供 足够 的 带宽 ， 要 达到 所 需 的 吞吐 率 就 必须 通过 重复 或 交替 的 方式 并 联 使 用 多 
个 基本 存储 体 。 


25.1 存储 器 的 基本 存储 体 


数字 系统 中 ， 绝 大 多 数 存储 器 是 由 两 种 基本 类 型 的 基本 存储 体 组 成 : 片上 的 SRAM (静态 
存储 器 ) 阵列 和 片 外 的 SDDR DRAM 芯片 在 这 里 我 们 把 这 些 基 本 存储 体 看 作 一 个 黑金 子 ， 
只 讨论 它们 的 特性 及 如 何 使 用 ， 对 于 其 内 部 结构 及 实现 不 做 讨论 。 


25. 1.1 SRAM 阵列 


片上 SRAM 阵列 可 以 构建 小 型 、 快 速 、 专 用 的 存储 器 ， 通 常 这 些 阵 列 与 读 写 数据 的 逻辑 电 
路 集成 在 一 起 。 一 个 SRAM 芯片 的 容量 相对 较 小 〈 约 400 Mb), ， 而 一 个 DRAM 芯片 可 以 有 4 Gb 
的 容量 ,但 SRAM 阵列 读 写 速度 快 ， 可 以 在 一 个 时 钟 周期 内 完成 ， 访 问 DRAM 则 需要 花费 25 
个 以 上 的 周期 。 多 个 SRAM 阵列 并 行 工 作 ， 可 以 实现 高 聚合 带宽 的 存储 器 。 例 如 ， 一 个 64 Mb 
的 必 片 由 1024 个 1Kx64 的 SRAM 组 成 ,工作 频率 为 1 GHz 时 ， 聚合 带宽 可 达 8 TB/s。 相 反 ， 
一 个 典型 的 DRAM 芯片 带宽 仅 为 1 GB/s 或 更 小 。SRAM 另 一 个 重要 的 优势 是 它 位 于 片上 ， 紧 
邻 使 用 它 的 逻辑 电路 。 如 果 SRAM 位 于 芯片 男 一 侧 ， 此 时 SRAM 就 不 具备 单 周 期 存 取 的 优势 
了 ,访问 时 间 需 要 20 个 周期 。 如 果 位 于 男 一 个 芯片 上 ,访问 时 间 会 更 长 。 

正如 第 8.9 WT, SRAM 接受 地 址 信息 、 数 据 输入 信息 和 一 个 写 信 和 号， 产生 数据 输出 信 
息 。 理 论 上 一 个 SRAM 可 以 有 任意 数量 的 端口 P, 但 是 由 于 生产 成 本 以 P 为 系数 增加 ， 因 此 
大 多 数 SRAM 都 是 单 端口 的 。 在 实际 应 用 中 , 也 经 常见 到 同时 具备 读 、 写 信号 的 双 端 口 
SRAM。 但 端口 数 超过 两 个 以 上 的 SRAM 就 不 多 见 了 ， 因 为 这 种 SRAM 造价 非常 昂贵 。 

大 多 数 SRAM 采用 同步 方式 ， 即 在 一 个 时 钟 下 工作 ， 如 图 25-1 所 示 。 每 个 周期 各 端口 可 
以 分 别 执行 一 次 读 取 或 写 人 操作 。 写 数据 时 ， 地 址 和 数据 在 时 钟 的 上 升 沿 前 1, 开始 建立 ， 并 在 
时 钟 沿 后 保持 i,。 读 数据 时 ， 需 在 时 钟 的 上 升 沿 后 经 过 一 定 的 延迟 (T...) 再 读 取 的 数据 才能 


3 SRAM 表示 静态 随机 存 取 存储 器 ; DRAM 是 动态 随机 存 取 存储 器 的 缩写 。 
O 这 里 不 考虑 能 持久 保存 数据 的 非 易 失 性 存储 器 ， 如 flash 和 磁盘 。 
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保证 数据 有 效 。 需 要 注意 的 是 ， 时 钟 周期 必须 足够 长 ， 以 便 有 充足 的 时 间 完 成 写 操作 、 内 部 预 
充电 及 其 他 内 部 操作 。 对 于 大 多 数 的 SRAM 而 言 ， 在 一 个 周期 内 同时 对 一 地 址 进行 读 、 写 操 
作 ， 可 能 会 导致 读 出 不 确定 的 数 ， 见 图 中 周期 3。 





ramo ca fe 


图 25-1 一 个 同步 双 端 口 SRAM 的 工作 时 序 。 当 读 / 写 (分 别 用 r 和 w 表示 ) 信号 在 时 钟 上 升 
沿 时 ， 地 址 ra/wa 的 数据 被 读 取 / 写 入 。 读 写 信号 、 地 址 和 数据 都 有 建立 和 保持 时 
间 。 读 取 时 ， 从 时 钟 沿 到 读 出 数据 ， 时 间 为 Qa 


SRAM 被 组 织 成 具有 行 译 码 器 和 列 多 路 选择 器 的 单元 阵列 ， 这 与 图 8-44 中 的 ROM 相似 ， 
不 同 的 是 ，SRAM 单元 位 于 字 线 与 位 线 的 交界 处 。 电 气 约 束 限制 了 SRAM 基本 阵列 的 最 大 尺 
寸 ， 其 行 和 列 均 不 超过 256 (64 Kb 或 4 KB)。 一 个 大 小 为 256 x 256 的 SRAM 阵列 可 以 实现 
64 K x1 位 或 256 x 256 位 的 RAM,。 这 是 该 阵列 所 能 实现 RAM 的 两 个 极端 情况 。 在 这 之 间 ， 还 
可 以 有 其 他 组 合 的 RAM， 例如 2 K x32 位 的 RAM, 一 个 包含 译 码 器 和 多 路 选择 器 的 SRAM 阵 
Bll, 通常 可 以 在 一 个 时 钟 周期 内 完成 数据 传送 。 
如 果 需 要 的 RAM 容量 大 于 4 KB 或 宽度 超过 256 位 时 ， 必 须 将 多 个 RAM 阵列 组 合 起 来 ， 
采用 位 片 或 存储 体 的 方式 来 实现 (第 25.2 Y). 


25.1.2 DRAM 芯片 


DRAM 是 一 种 快速 的 片 外 存储 器 ， 其 位 成 本 最 低 。 当 前 DRAM 芯片 容量 可 达 4 Gb, HE 
超过 了 单 芯片 SRAM 的 存储 量 。 但 是 大 容量 会 造成 高 的 延迟 ， 现 代 SDDR 3 内 存 芯片 的 延迟 约 
为 20 ns， 而 片上 SRAM 阵列 的 延迟 仅 为 400 ps. 

从 本 质 上 而 言 ， 动 态 存储 器 并 不 比 静态 存储 器 慢 。 但 是 ， 商品 化 后 的 DRAM 芯片 却 比 片上 
SRAM 阵列 慢 很 多 ,这 里 主要 有 三 个 原因 。 第 一 ，DRAM 芯片 是 独立 的 ， 很 大 一 部 分 延迟 花费 在 与 
接口 的 交互 上 。 第 二 ， 由 于 存储 部 件 容量 大 ， 通 过 片上 总 线 访 问 芯片 内 部 子 阵列 时 需要 花费 很 多 时 
间 。 第 三 ， 因 为 DRAM 芯片 所 在 系统 的 通信 延迟 很 高 ， 很 难 再 对 片 内 子 阵 列 的 速度 进行 优化 。 

虽然 对 大 多 应 用 程序 而 言 ， 一 个 DRAM 芯片 就 足够 了 。 但 通常 情况 下 人 们 会 将 DRAM 作 
为 模块 ， 将 几 个 DRAM 芯片 按 位 片 方式 组 合 起 来 形成 一 个 存储 器 (26 25.2 节 )。 或 者 将 多 个 
模块 交错 使 用 (2625.3 节 ) 来 实现 更 高 带宽 的 存储 器 。 例 如 ， 高 性 能 CPU 的 存储 器 就 是 按照 
这 种 方式 来 组 织 的 。 本 节 主 要 讨论 单个 DRAM 芯片 的 使 用 。 

读 (或 写 ) DRAM 模块 需要 三 步 : 行 激活 、 列 访问 和 预 充 电 ， 如 图 25-2 和 图 25-3 所 示 。 





O 在 一 些 RAM 中 最 小 的 列 复 用 要 求 是 2 或 4， 位 数 最 宽 的 RAM 可 分 别 用 宽度 为 128 位 或 64 位 的 存储 阵列 实现 。 
O 这 里 的 “ 快 ” 表 示 随 机 读 写 访问 可 以 到 100 ns RED, Nash 和 磁盘 位 成 本 更 低 ， 但 速度 太 慢 ,在 很 多 应 用 中 
无 法 用 作 主 存 。 
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DRAM 模块 的 接口 由 地 址 总 线 、 数 据 总 线 和 控制 总 线 组 成 。 由 于 DRAM 模块 的 引 脚 数 有 限 ， 地 
址 总 线 和 数据 总 线 采 用 串 行 化 方式 。 地 址 由 三 个 字段 组 成 ， 分 别 表示 体 、 行 和 列 。 读 取 DRAM 
的 某 一 地 址 时 ， 第 一 步 读 取 的 是 体 地 址 (地址 高 位 ) 和 行 地 址 (地址 中 位 )， 从 而 激活 选 定 存 
储 体 上 的 某 一 行 。 行 激活 能 将 所 选 存储 体 上 的 某 行 数据 读 取 到 存储 体 的 读 出 放大 器 中 ， 如 
图 25-3a 所 示 。 读 取 数 据 的 过 程 会 破坏 存储 数据 ， 所 以 行 激活 结束 时 ， 存 储 器 处 于 未 知 状态 
如 图 25-3b 所 示 。 在 发 出 列 地 址 和 命令 前 ， 控 制 器 必须 等 待 ino, ， 这 一 延迟 用 来 完成 和 激活 。 
在 这 段 时 间 内 ， 可 以 对 其 他 存储 体 进 行 操作 。 


周期 1 2 3 á S 6 7 8 9 10 T 12 33 34 35 436 1337 18 


ak CULL PLP r PLP PP Ae 
ema GRGA) rd. 


bred > 


“e aslo) Gs) — Ge) — be) s) —@Ə 
data 
图 25-2 DRAM 芯片 的 工作 时 序 。 在 周期 2 发 出 命令 激活 存储 体 0 上 的 第 0 行 。 在 周期 3 发 出 第 二 个 
命令 激活 存储 体 3 上 的 第 6 行 。 经 过 ico 延 迟 后 ， 在 周期 4 发 出 命令 读 取 存 储 体 0 并 激活 行 
上 的 第 0 列 数据 。 经 过 tcl， 从 周期 7 开始 输出 数据 。 访 问 同一 存储 体 上 不 同行 时 ， 该 行 必 

须 预 充电 (如 周期 8) 。 如 果 访 问 同一 行 中 的 不 同 列 ， 不 需要 预 充 电 ， 如 周期 10 


激活 <B,， R> 读 取 <B,， C> 
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c) 预 充 电 <B,, R> 
图 25-3 DRAM 存储 体 读 取 步 又 。a) 首先 激活 某 一 行 ， 将 数据 送 入 读 出 放大 器 中 。 读 取 会 
破坏 存储 的 数据 。b) 接着 ， 对 激活 行 上 的 某 一 列 发 出 读 取 和 写 入 命令 。 最 后 ,在 
e) 中 ， 发 出 预 充电 命令 将 该 行 写 回 存储 器 。 读 取 同 一 行 上 的 多 个 列 时 不 需要 预 充 
电 /激活 序列 。 此 外 ， 同 一 时 间 可 以 激活 不 同 存储 体 上 的 多 个 行 





© RCD 表示 从 RAS 到 CAS 的 延迟 ， 源 自 异 步 DRAM。 可 以 把 它 看 作 行 到 列 的 延迟 。 
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行 激活 结束 后 ， 在 体 地 址 和 列 地 址 有 效 期 间 ， 发 出 读 取 (或 写 入 ) 命令 。 经 过 列 地 址 选 
通 延 迟 ta, (CAS 延迟 或 列 延迟 ) 后 ， 数 据 的 第 一 个 字 出 现在 数据 引 脚 。 之 后 以 一 种 突 发 方式 ， 
每 个 周期 输出 一 个 新 字 ， 直 到 数据 全 部 读 出 。 一 个 行 被 激活 后 可 以 进行 多 次 读 写 操作 ， 期 间 
不 需要 再 次 进行 激活 。 

当 一 行 上 所 有 的 读 写 操作 执行 完 后 ， 需 要 进行 预 充电 ， 通 过 读 出 放大 器 将 数据 写 回 存储 器 
阵列 (图 3-25c)。 发 出 预 充电 命令 (图 25-2 中 的 周期 8) 后 ， 如 果 想 激活 同一 存储 体 上 其 他 
行 ， 控 制 器 必须 等 待 尺 ， 以 便 完成 预 充电 操作 。 在 这 个 延迟 时 间 里 ， 可 以 访问 其 他 存储 体 。 

与 SRAM 不 同 ，DRAM 处理 两 个 连续 请 求 时 ， 延 迟 与 访问 地 址 有 很 大 的 关系 。 访 问 一 个 已 
激活 行 时 ， 延 迟 时 间 是 ta。 访问 一 个 已 完成 预 充电 的 新 行 时 ， 延 迟 时 间 是 treo + la。 访问 存储 
体 上 的 某 行 时 首先 必须 充电 以 激活 该 行 ， 其 延迟 时 间 是 treo tia +e 文献 [94] 中 提 到 了 对 
存储 器 控制 器 的 优化 ， 也 就 是 在 出 现 大 量 存储 器 的 访问 请 求 时 ， 采 取 乱 序 操 作 ， 即 在 行 切换 前 
集中 处 理 当前 激活 行 的 请 求 。 

每 次 存储 器 访问 返回 的 数据 量 称 为 存储 单元 。 理 想 情 况 下 ， 每 次 读 取 的 存储 单元 上 所 有 位 
都 是 有 用 的 。SRAM 阵列 大 小 可 以 根据 需要 设置 成 与 存储 单元 一 致 ， 通 常情 况 下 ，DRAM 存储 
单元 大 小 会 采用 一 个 最 小 值 。 这 个 最 小 值 通常 是 几 个 字 的 长 度 。 当 需要 的 数据 宽度 小 于 存储 单 
元 的 最 小 值 时 ， 会 造成 能 源 和 带宽 的 浪费 。 

将 DRAM 接口 标准 化 ， 有 利于 在 各 种 类 型 的 系统 中 采用 不 同 三 商 的 芯片 。JEDEC 标准 体 
系 中 规定 了 某 种 类 型 DRAM 的 规格 ， 如 DDR3 或 CDDR5 ， 各 个 厂商 可 以 按照 标准 生产 符合 规 
格 的 零件 。 这 些 标准 包括 引 脚 的 定义 、 信 和 号 发 送 的 方式 和 各 种 命令 。 

在 一 个 标准 中 ，DRAM 性 能 由 时 钟 频率 和 各 操作 的 延迟 决定 。 例 如 ， 一 个 SDDR3 DRAM 时 序 
HH fans ters tros tre All ters (激活 和 预 充 电 命令 之 间 的 最 小 时 间 ) 决定 。 一 个 参数 为 DDR3 - 1600 
8-8 -8 -24 的 内 存 ， 其 VO 时 钟 为 800 MHz” ， 除 了 ms 需要 24 个 时 钟 周期 外 ， 其 余 都 为 8 个 
周期 。 如 果 从 已 打开 的 行 中 读 取 一 列 ， 需 要 8 个 时 钟 周期 (时 钟 周 期 为 1.25 ns), 或 者 说 需要 
10 ns, 


25.2 用 位 片 和 存储 体 构造 存储 器 


当 我 们 需要 一 个 比 用 单一 基本 存储 器 (RAM BR DRAM) 构建 的 容量 更 大 或 位 数 更 宽 的 存 
储 器 时 ， 可 以 将 若干 个 基本 存储 体 通过 位 片 或 存储 体 方式 组 合 起 来 。 通 过 位 片 方式 ， 可 以 将 存 
储 器 子 系统 的 各 个 位 划分 在 不 同 的 基本 存储 体内 。 通 过 存储 体 方式 ， 可 以 将 基本 存储 体 划分 到 
存储 器 子 系统 的 不 同 地 址 空间 上 。 这 两 种 方法 也 可 以 结合 起 来 使 用 ， 从 而 使 所 用 基本 存储 体 覆 
盖 整 个 地 。 

假设 我 们 需要 组 成 一 个 容量 为 1 Mb (128 KB) 的 SRAM 存储 阵列 ， 可 用 的 存储 阵列 容量 
为 16 Kx64。 图 25-4 给 出 了 采用 位 片 方 式 (图 25-4a) 和 存储 体 方式 (图 25-4b) 实现 该 存储 
器 的 原理 。 如 果 采 用 位 片 方式 ， 地 址 平行 分 布 到 16 个 16 K x4 的 阵列 上 ， 每 个 阵列 提供 4 位 输 
出 。 如 果 采 用 存储 体 方 式 ， 地 址 线 高 位 经 译 码 后 选取 16 个 1 Kx64 的 阵列 中 的 一 个 。 地 址 的 
低位 发 送 到 所 有 存储 体 的 片 内 地 址 上 ， 并 从 所 有 存储 体 上 选择 一 个 字 作 为 输出 。 高 位 地 址 经 译 
码 后 再 选中 其 中 一 个 存储 体 ， 这 样 仅 有 一 个 存储 体 上 的 字 被 输出 。 

这 两 种 结构 具有 相同 的 容量 (1 Mb) 和 带宽 (每 个 周期 8 B)。 此 外 ,在 存储 系统 的 实际 
设计 中 ， 无 论 采 用 位 片 方式 还 是 存储 体 方式 ， 通 常 将 基本 存储 体 布 局 成 一 个 4 x4 的 二 维 阵列 。 





O ”在 双 倍 数据 速率 〈DDR) 存储 器 中 ， 单 独 的 数据 字 传 输 需 要 半 个 时 钟 周期 。 
© ”对 于 双 倍 数据 速率 (DDR) 存储 器 ， 数 据 传输 是 时 钟 速率 的 两 倍 ， 即 1600 MHz， 因 此 DDR3 - 1600 的 时 钟 频 
率 为 800 MHz, 
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图 25-4 增加 存储 器 容量 的 两 种 方法 。a) 位 片 。 将 每 一 个 基本 存储 体 中 读 取 的 部 分 字 组 
合 后 输出 。b) 存储 体 。 通 过 地 址 的 高 位 选取 其 中 一 个 基本 存储 体 ， 然 后 读 取 该 
基本 存储 体 中 的 一 行 字 作 为 输出 。 采 用 存储 体 方式 时 ， 未 被 选中 的 基本 存储 体 处 
于 未 激活 状态 ， 可 减少 功 耗 


在 采用 位 片 方式 的 存储 器 中 ， 由 于 每 个 阵列 只 存储 数据 的 一 部 分 ， 完 成 一 次 操作 需要 访问 
所 有 的 存储 阵列 。 而 采用 存储 体 方式 的 存储 器 ， 只 需要 访问 其 中 一 个 阵列 。 译 码 后 只 激活 选 定 
阵列 ， 而 其 他 阵列 处 于 闲置 状态 ， 因 此 存储 体 方式 比 位 片 方式 的 能 耗 低 。 

图 25-5 给 出 了 一 个 既 采 用 位 片 方式 又 采用 存储 体 方式 构建 的 存储 系统 。 该 存储 系统 用 了 
16 个 基本 存储 体 ， 每 个 容量 为 4K x16， 对 4 个 阵列 (一行 ) 读 (或 写 ) ， 就 是 一 个 完整 的 64 
位 。4 行 ( 按 存储 体 寻 址 ) 可 提供 容量 为 1 Mb 的 存储 系统 。 每 次 读 写 请 求 会 激活 同一 行 上 的 4 
个 基本 存储 体 ， 而 其 他 12 个 基本 存储 体 则 处 于 空闲 状态 。 

这 里 的 存储 器 结构 是 用 高 位 地 址 选择 存储 体 ， 但 这 并 不 是 唯一 的 方法 。 如 果 不 需 要 地 址 连 
续 ， 任 何 一 组 地 址 位 都 可 以 用 来 选择 存储 体 。 为 保证 地 址 连续 ， 大 多 数 的 存储 器 系统 都 使 用 高 
位 地 址 。 


25.3 交叉 存储 器 


为 了 增加 存储 带宽 可 以 允许 多 个 请 求 同 时 访问 多 个 存储 体 。 用 交叉 开关 (24.3 h) RE 
图 25-4 和 图 25-5 中 的 地 址 分 配方 式 ， 就 可 以 同时 访问 多 个 存储 体 ， 如 图 25-6 所 示 。 当 有 多 个 
访 存 请 求 时 ， 访 问 哪 个 存储 体 与 它们 的 访 存 地 址 有 关 。 这 种 结构 允许 一 个 周期 内 存在 多 个 访 存 
请 求 。 当 然 ， 这 些 存 储 体 也 可 以 进一步 通过 位 片 和 划分 存储 体 来 实现 。 

经 过 上 述 修改 后 ， 理 想 情 况 下 存储 系统 的 带宽 可 以 从 每 周期 一 个 字 增 加 到 min N, M) 
DF, 其 中 M 是 请 求 者 的 数量 ,，N 是 交叉 的 存储 体 个 数 。 但 是 这 个 峰值 带宽 并 不 是 总 能 达 
到 。 如 果 出 现 两 个 请 求 访问 同一 存储 体 的 情况 时 就 会 产生 冲突 ， 其 中 一 个 请 求 会 被 推迟 。 
在 某 个 周期 内 ， 对 于 一 个 或 多 个 存储 体 而 言 ， 如 果 其 地 址 空间 没有 访问 请 求 ， 该 存储 体 处 
于 空闲 状态 。 

当 存储 体 的 数量 是 2 的 宕 次 方 时 ， 可 用 地 址 中 的 某 些 位 作 片 选 。 通 常情 况 下 ， 用 地 址 的 中 
间 位 做 片 选 ， 如 表 25-1 所 示 。 地 址 的 低 45 位 用 来 确定 块 中 的 字 节 数 ， 这 里 所 说 的 块 表示 在 移 
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fey 存储 体 20 
awas 4 Kx16 
ee 存储 体 21 
ie 4 Kx16 








图 25-S 采用 位 片 方式 和 存储 体 方式 构建 的 存储 系统 。 同 一 存储 体内 所 有 阵列 对 同一 个 请 
求 做 出 读 (或 写 ) 的 响应 。 在 该 系统 中 同一 时 刻 只 能 有 一 个 请 求 有 效 


{a, di, cmd}, 


(a, di, cmd} x41) 


图 25-6 具有 个 存储 体 的 交叉 存储 器 ， 其 中 仲裁 器 可 以 仲裁 M MER TOR AME r Z fh 
裁 器 仲裁 后 ， 发 出 gnt， 通 过 交叉 开关 授权 请 求 者 访问 存储 体 


动 到 下 一 个 存储 体 前 ,映射 到 一 个 存储 体 中 的 内 存 数 量 。 接 下 来 的 n= log (N) 位 用 来 选择 存 
储 体 。 其 余 位 用 来 选择 存储 体内 部 的 块 。 这 种 地 址 映射 能 够 将 连续 地 址 映射 到 不 同 的 存储 体 
上 ， 当 访 存 请 求 集中 在 某 一 连续 地 址 空间 时 ， 发 生 冲 突 的 存储 体 数量 会 减少 。 





日 与 25.4 节 中 所 讨论 的 一 致 ， 这 种 说 法 可 以 被 看 作 空间 局 部 性 。 
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25-1 某 交 叉 存 储 器 系统 中 地 址 各 字段 的 含义 














位 
b-1: 0 


描 OR 





每 个 块 中 包含 8=2* 字 节 
N=2" 个 存储 体 
每 个 存储 体 中 包含 4 =2? 个 块 





n+b-1: b 





at+n+b-1: n+b 


采用 交叉 存储 器 ， 每 个 请 求 都 可 以 获准 访问 某 个 特定 的 存储 体 。 如 果 开 关 分 配器 只 能 访问 
每 个 队列 的 队 首 ， 就 会 出 现 队 首 阻塞 ,存储 右 系 统 将 无 法 得 到 充分 使 用 ， 如 表 25-2 所 示 。 即 
使 要 访问 空闲 的 存储 体 ， 这 些 请 求 也 会 被 阻塞 在 各 自 队 列 的 其 他 请 求 之 后 。 表 25-3 允许 开关 
分 配器 乱 序 处 理 队 列 中 出 现 的 请 求 ， 存 储 器 获得 较 高 的 使 用 率 。 从 该 表 中 可 以 看 出 ， 存 储 器 得 
到 了 充分 利用 。 

即使 分 配器 能 够 避免 队 首 阻塞 存储 体 上 的 负载 均衡 也 会 限制 存储 器 的 使 用 。 访 存 请 求 如 
能 均匀 地 分 布 在 整个 存储 体 上 ， 就 可 以 最 大 限度 地 提高 存储 器 的 吞吐 量 。 通 常情 况 下 ， 可 以 利 
用 地 址 的 中 间 位 作 片 选 ， 与 高 位 作 片 选 相 比 ， 这 种 方式 能 够 使 访 存 请 求 分 布 更 均匀 。 但 是 也 会 
存在 一 些 特 例 ， 如 某 些 病态 情况 下 会 出 现 访问 跨度 较 大 但 地 址 中 间 位 不 改变 的 状况 。 


表 25-2 出 现 队 首 阻塞 ， 存 储 系统 没有 获得 最 大 吞吐 率 ; 因 某 个 资源 被 过 度 请 求 ， 本 来 可 以 授权 的 
请 求 被 阻塞 



































表 25-3 ” 当 仲裁 器 能 够 获悉 除 队 首 外 的 其 他 请 求 时 ， 存 储 系 统 不 会 出 现 队 首 阻 塞 ， 从 而 实现 最 大 的 
吞吐 率 





























如 果 一 个 交叉 存储 器 有 N 个 存储 体 且 块 的 大 小 是 B 字 节 ， 在 满足 下 式 的 情况 下 ， 存 储 地 

址 ay Al a, 将 访问 相同 的 存储 体 。 
Aa = (a, -ai), mod( NB) = 0 (25-1) 

例如 ， 有 一 个 256 x256 的 双 精 度 浮 点 数 数组 (每 个 浮 点 数 占 8 字 节 ) 。 如 果 我 们 要 访问 该 
数组 中 的 一 列 ，Aa =2048。 当 NB 小 于 4096 AE 2 的 索 次 方 时 ， 对 于 任何 交叉 存储 系统 的 访问 
都 会 落 在 同一 个 存储 体 上 。 

避免 发 生存 储 体 冲突 的 最 简单 方法 是 在 填充 存储 阵列 时 ， 行 的 大 小 与 存储 体 的 个 数 互 质 。 
例如 ， 如 果 我 们 存储 256 x 256 的 阵列 时 ， 将 其 看 作 一 个 257 x 256 的 阵列 ，Aa 变 成 2056， 这 
时 就 可 以 均匀 地 访问 整个 存储 体 了 。 
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为 避免 存储 体 的 冲突 ， 人 们 已 经 提出 了 许多 硬件 解决 方案 ， 如 使 用 一 个 质数 存储 体 。 但 
是 ， 这 些 解决 方案 成 本 较 高 ， 当 访问 间隔 Aa 是 存储 体 数 量 的 倍数 时 ， 仍 然 会 产生 冲突 。 此 时 
首选 方案 是 采用 软件 方式 来 填充 阵列 或 尽量 避免 出 现 造 成 冲突 的 访问 间隔 。 

在 实际 存储 系统 中 ， 不 是 所 有 请 求 都 具有 相同 的 优先 级 。 例 如 ， 数据 加 载 请 求 比 数据 存储 
的 优先 级 要 高 。 在 这 种 情况 下 ， 我 们 可 以 将 每 一 类 请 求 存 人 不 同 的 缓冲 中 。 高 优先 级 的 请 求 能 
够 比 低 优先 级 的 请 求 优 先 获 得 响应 。 当 不 断 出 现 高 优先 级 请 求 时 ， 不 给 较 低 优先 级 请 求 访问 授 
权 ， 可 能 会 “人 馈 死 ” 低 优先 级 请 求 。 为 了 保证 系统 性 能 ， 可 以 为 优先 级 增加 等 待 时 间或 为 每 
类 请 求 分 配 一 定量 的 静态 资源 。 例 如 ， 当 有 4 个 高 优先 级 的 请 求 获得 授权 后 ， 一 个 低 优 先 级 的 
请 求 必须 赢得 仲裁 。 

当 仲裁 对 象 变 为 DRAM 时 ， 这 个 问题 会 变 得 更 加 困难 ， 因 为 访问 DRAM 的 时 间 与 地 址 相 
关 ， 而 且 控 制 器 必须 决定 何 时 打开 一 个 新 行 。 现 代 内 存 控制 器 要 在 实现 最 大 吞吐 率 和 为 所 有 请 
求 提供 基本 的 服务 质量 之 间 做 好 平衡 。 


25.4 高 速 缓存 

当 我 们 设计 一 个 存储 系统 时 ， 需 要 面临 的 一 个 问题 是 如 何在 容量 和 速度 之 间 进 行 折 中 。 
DRAM 可 以 提供 千 兆 字 节 的 存储 容量 ， 但 访问 时 间 会 超过 100 个 周期 。 小 的 SRAM 阵列 可 以 在 
一 个 周期 内 实现 访问 ,但 容量 只 有 16 ~ 64 KB。 将 这 两 种 存储 器 结合 起 来 形成 一 个 存储 层次 就 
可 以 做 到 两 全 其 美 。 容 量 小 、 存 取 速 度 快 的 存储 阵列 用 来 存储 那些 频繁 访问 的 数据 ， 而 容量 
大 、 存 取 速 度 慢 的 存储 器 用 来 存储 其 他 数据 。 如 果 设 计 者 或 程序 员 清 楚 每 类 存储 器 中 会 存 人 哪 
些 数 据 ， 就 可 以 使 用 图 25-7a 所 示 的 层次 结构 来 设计 存储 系统 。 每 类 存储 器 可 以 分 配 相 应 的 地 
址 空间 。 根 据 访 问 地 址 ， 将 请 求 分 配给 三 个 存储 阵列 中 的 某 一 个 进行 处 理 。 


16 GB 
A [200107fff:108000] 


16 GB 
A [200000000:0) 


1 MB MRU 1 MB 
A [107fff:8000] 


32 KB MRU 32 KB 
A [7fff:0] 





图 25-7 将 各 种 存储 器 组 织 起 来 形成 存储 体系 结构 可 以 增加 容量 和 延迟 。a) 明确 划分 各 层 
次 ， 其 中 每 个 地 址 映射 到 一 个 特定 的 存储 器 上 。b) 采用 隐 式 管理 的 cache 体系 结 
构 ， 其 中 两 个 较 小 的 存储 器 保存 最 近 使 用 的 字 (MRU) 


但 是 ， 当 数据 的 访问 情况 未 知 时 ， 情 况 会 有 所 不 同 。 例 如 ， 显 卡 对 游戏 进行 泻 染 时 要 访问 
许多 纹理 ,” 在 一 个 给 定 的 场景 下 这 些 纹理 只 是 全 部 纹理 的 一 个 子 集 。 需 要 哪些 纹理 事先 是 不 
知道 的 ， 但 是 只 要 使 用 过 一 次 ， 这 些 纹理 就 有 可 能 会 在 下 一 像素 、 下 一 对 象 或 下 一 帧 中 再 次 使 
用 。 如 球员 在 一 个 充满 阳光 的 草坪 上 走动 时 ， 只 有 草 的 纹理 是 需要 经 常 访问 的 。 沙 子 、 砖 、 雪 


和 月 亮 的 纹理 都 可 以 存储 在 DRAM 中 ， 而 且 这 样 还 不 会 损失 性 能 。 


日 图 像 被 “ 画 ” 到 屏幕 中 的 显示 对 和 象 上 。 
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这 种 方式 其 实 利 用 的 是 时 间 局 部 性 的 原则 ， 即 最 近 被 使 用 的 数据 可 能 会 在 不 久 的 将 来 再 次 
使 用 。 草 的 纹理 可 以 被 周围 的 像素 使 用 ， 也 可 在 几 个 对 象 和 几 个 连续 的 帧 中 使 用 。 同 样 ， 当 沙 
的 纹理 被 加 载 后 ， 它 也 可 以 被 重复 使 用 。 

此 外 ， 数 据 访 问 还 具有 空间 局 部 性 的 特点 ， 即 与 刚刚 被 访问 的 数据 接近 ( 相 邻 地 址 ) 的 
数据 ， 在 不 久 的 将 来 也 有 可 能 被 使 用 。 例 如 ， 我 们 正在 使 用 草 的 纹理 上 的 某 一 像素 ， 很 有 可 能 
会 使 用 该 像素 的 相 邻 像素 。 在 习题 25. 6 中 ,我 们 将 通过 块 的 大 小 来 分 析 空 间 局 部 性 。 

我 们 可 以 利用 时 间 局 部 性 原则 ， 将 最 近 使 用 的 数据 保存 在 一 个 容量 小 、 存 取 速 度 快 的 存储 
器 中 ， 该 存储 器 称 为 高 速 缓存 (cache) 。 对 于 存储 在 cache 中 的 每 个 数据 元 素 ， 我 们 也 可 以 设 
置 一 个 标签 ， 该 标签 包括 数据 元 素 的 地 址 和 一 些 状 态 信息 。 在 读 操作 期 间 ， 每 级 cache 按 顺 序 
检查 请 求 地 址 ， 查 看 本 级 中 是 否 有 请 求 数据 的 副本 。 如 果 LL 缓存 发 现 有 一 个 标签 包含 请 求 地 
HE (cache 命中 ) LI 以 最 小 的 延迟 提供 相关 数据 。 如 果 Ll 缓存 中 没有 找到 匹配 的 请 求 地 址 
(cache 未 命中 ) ， 继 续 搜索 L2 缓存。 如 果 在 所 有 缓存 中 都 没有 找到 数据 元 素 ， 即 数据 未 命中 ， 
则 该 数据 由 DRAM 提供 。 当 数据 元 素 从 DRAM 中 返回 后 ， 连 同 地 址 存储 在 Ll cache 中 ， 这 是 
因为 该 数据 为 最 近 访问 的 数据 元 素 。 当 新 数据 进入 cache 后 ,为 了 腾 出 空间 ,一 些 旧 的 (不 是 
最 近 访 问 的 ) 数据 可 能 需要 被 移出 。 

作为 一 种 典型 的 访问 模式 ， 保 留 最 近 访 问 的 数据 可 以 大 大 提高 命中 率 。 用 一 个 流行 的 基准 
测试 程序 测试 一 个 Ll 缓存 大 小 为 32 KB 的 典型 微 处 理 器 ， 其 命中 率 可 以 达到 98% 。 如 此 高 的 
命中 率 意味 着 处 理 器 几乎 总 是 (98% 的 时 间 ) 工作 在 一 个 既 有 Ll 缓存 的 低 延 迟 、 高 带宽 又 具 
有 DRAM 的 大 容量 特征 的 存储 系统 中 。 依 靠 良 好 的 局 部 性 原则 ，cache 体系 结构 给 我 们 提高 了 
一 个 大 容量 、 快 速 存 取 的 存储 器 。 

缓存 由 标签 存储 器 和 数据 存储 器 组 成 。 标 
签 存储 器 存放 地 址 ， 数 据 存储 器 存放 与 标签 相 
关 的 行 ?, 该 行 由 多 个 相 邻 的 字 组 成 。 在 全 相 
联 高 速 缓存 中 ， 内 容 可 寻 址 存储 器 (CAM) 用 
来 存储 标签 ， 如 图 25-8 所 示 。CAM 的 输入 信 
息 是 要 访问 的 地 址 。CAM 的 输出 是 一 个 独 热 信 
号 ， 用 来 指示 所 对 应 的 地 址 。 这 些 由 独 热 信号 
形成 的 阵列 可 以 使 能 相应 的 数据 线 ， 使 其 与 数 
据 存储 器 的 输出 相连 。 如 果 在 标签 CAM 中 没 
有 发 现 匹 配 的 地 址 则 未 命中 ， 请 求 将 被 传 到 存 
储 体系 的 下 一 级 。 尽 管 这 种 全 相连 的 结构 很 简 
单 ， 但 它 往往 只 用 在 非常 小 的 cache 上 (F 





64 个 ) ， 因 为 CAM 阵列 大 而 且 速 度 缓慢 。 图 25-8 ”一 个 由 标签 CAM 和 数据 RAM 组 成 的 全 

表 25-4 列 出 了 连续 访问 一 个 全 相连 cache 相连 cache。 读 访问 时 ， 地 址 高 位 与 标签 
的 过 程 。 如 果 人 缺失 ， 所 请 求 的 数据 从 DRAM ik CAM 中 的 每 一 个 有 效 地 址 作 比 较 。 如 果 
回 时 被 存 人 cache。 如 果 cache 已 满 ， 必 须 从 匹配 (命中 )， 相 关 的 字 线 变 高 电 平 ， 
cache 中 移出 一 行 数据 。 从 cache 中 移出 数据 有 输出 数据 存储 器 中 对 应 的 数据 。 低 地 址 
很 多 方法 ， 如 最 近 最 少 访问 法 。 用 来 选择 cache 抉 中 的 字 


对 于 容量 太 大 无 法 用 CAM 阵列 实现 的 cache 存储 器 可 以 采用 直接 映射 方式 。 如 图 25-9 所 
示 ， 将 标签 存储 在 一 个 常规 的 RAM 中 (而 不 是 CAM 中 ) 。 通 过 存储 器 地 址 的 中 间 位 访问 标签 





O RHF 





与 cache 标签 相关 的 一 块 数据 ， 有 时 被 称 为 cache 块 。 
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和 数据 阵列 。 读 取 标 签 阵列 之 后 ， 将 请 求 地址 的 高 位 与 标签 作 比 较 。 如 果 地 址 的 高 位 与 标签 匹 
配 〈 命 中 ) ， 从 数据 RAM 中 读 出 数据 输出 。 


表 25-4 ”一 个 全 相连 映射 的 cache， 该 cache 被 分 成 4 块 。 表 中 列 出 了 发 出 请 求 时 各 块 中 的 标签 分 
布 及 当前 请 求 的 命中 情况 



































表 25-5 列 出 了 一 个 简单 的 块 数 为 4 的 cache 
的 访问 模式 及 标签 分 布 。 由 于 每 个 地 址 只 能 映射 
到 一 个 唯一 的 位 置 ， 即 使 cache 未 满 也 有 可 能 要 
从 cache 中 移出 数据 。 例 如 ， 相 邻 两 个 请 求 经 地 
址 映射 后 访问 相同 的 cache 空间 ， 尽 管 前 一 个 地 
址 的 数据 是 最 近 使 用 过 的 ， 也 需要 从 cache 中 移 
出 。 习 题 25. 7 中 将 讨论 组 相 联 cache， 其 中 每 行 
可 以 映射 到 w 个 位 置 中 的 任何 一 个 。 

在 cache 中 ， 每 个 标签 所 对 应 的 数据 即 
cache 块 通常 大 于 一 个 字 。 在 存储 体系 中 ， 
cache 同 较 高 级 存储 器 之 间 的 数据 传输 是 以 块 
为 单位 进行 的 。 大 多 数 块 的 大 小 在 32 ~ 128 
字 节 之 间 。 确 定 块 大 小 时 ， 既 要 考虑 空间 局 
部 性 还 要 尽量 减少 不 必要 的 数据 传输 ， 因 此 
需要 在 二 者 之 间 做 出 妥协 。 习 题 25.6 中 将 对 
这 一 问题 进行 探讨 。 


图 25-9 








标签 RAM 数据 RAM 















一 个 直接 映射 cache， 其 中 标签 存储 在 
RAM 阵列 中 。 地 址 最 低位 是 用 来 选择 
cache 块 中 的 输出 字 。 中 间 的 地 址 位 用 
来 读 取 标签 和 数据 阵列 。 地 址 的 高 位 
用 来 与 标签 阵列 输出 作 比 较 。 如 果 该 
地 址 与 读 出 的 标签 匹配 ， 则 命中 ， 输 
出 数据 阵列 中 的 数据 


表 25-5 一 个 块 数 为 4 的 直接 映射 cache, 位 [7: 6] 为 块 地 址 。 表 中 列 出 来 发 出 请 求 时 各 块 中 的 
标签 分 布 及 当前 请 求 的 命中 情况 






































内 存 访问 可 以 获得 很 多 信息 ， 这 些 信 息 有 时 不 仅仅 是 一 个 地 址 、 一 个 操作 和 一 个 数据 。 元 
数据 ， 如 数据 的 目的 地 址 ， 并 不 需要 出 现在 LI1 cache 缺失 中 ， 它 应 该 被 存 人 本 地 的 缺失 状态 保 
持 寄 存 器 (MSHR) 中 。 每 次 出 现 cache 缺失 时 ,在 送 到 存储 体系 的 上 一 层 前 会 分 配 一 个 
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MSHR ， 如 果 已 用 完 ， 需 要 排队 等 待 。 当 处 理 完 一 次 缺失 后 ，MSHR 数据 被 刷新 ， 并 释放 出 来 
供 继 续 使 用 。 

对 cache 进行 写 操作 时 也 会 出 现 缺失 的 现象 。 当 缺失 时 可 以 不 写 和 人 cache， 直 接 写 入 存储 器 
或 者 在 cache 中 分 配 一 行 ， 再 写 回 cache。 如 果 采 用 第 二 种 方式 ， 由 于 写 cache 时 只 提供 了 一 个 
字 ， 所 以 该 行 的 其 余部 分 必须 从 内 存 中 获取 。 缺 失 时 ， 写 操作 并 不 需要 这 些 额外 数据 。 为 了 减 
少 等 待 时 间 ， 可 以 将 写 入 cache 的 数据 预先 存 人 一 个 写 入 缓冲 器 中 ， 直 到 该 cache 块 其 余部 分 
从 内 存 读 回 。 所 有 负载 必须 查询 写 入 缓冲 器 ， 以 保证 读 取 的 数据 是 最 新 的 。 

在 多 处 理 器 系统 中 ,通常 每 个 处 理 器 (CPU) 都 拥有 一 个 LI 缓冲 。 为 了 确保 运算 正确 ， 
每 一 次 读 取 地 址 时 必须 读 取 最 新 写 和 人 的 数据 。 如 果 多 个 CPU 读 取 同一 个 地 址 ， 它 们 将 在 各 自 
的 cache 中 生成 一 个 副本 。 写 入 时 ， 为 保持 系统 一 致 ， 所 有 cache 中 对 应 的 那 一 块 要 么 全 部 无 
效 要 么 全 部 更 新 ， 即 只 允许 最 近 写 人 的 数据 能 被 后 续 的 读 操作 读 取 。 


小 结 


存储 吉 是 数字 系统 的 重要 组 成 部 分 。 存 储 子 系统 的 性 能 由 容量 、 延 迟 和 带宽 决定 ， 通 常 它 
是 由 一 个 或 多 个 基本 存储 体 组 成 ， 诸 如 SDDR DRAM 芯片 或 SRAM 阵列 。 

当 存储 器 子 系统 的 容量 大 于 单个 基本 存储 体 时 ， 可 以 将 多 个 基本 存储 体 组 合 起 来 ， 采 用 位 
片 、 存 储 体 或 二 者 结合 起 来 的 方式 实现 。 当 子 系统 需要 的 带宽 超过 单个 基本 存储 体 时 ， 可 以 采 
用 重复 或 交叉 方式 实现 。 在 交叉 存储 器 中 ， 多 个 输入 端口 可 通过 开关 连接 到 多 个 存储 器 体 上 。 
对 于 各 端口 同时 发 出 的 多 个 请 求 进行 有 效 的 调度 ， 可 以 避免 出 现 队 首 阻塞 。 

cache 存储 器 利用 了 局 部 性 原则 。 通 过 使 用 一 个 容量 小 、 存 取 速 度 快 的 存储 器 来 保存 最 近 
访问 过 的 数据 。 然 后 与 一 个 容量 大 、 存 取 速 度 慢 的 后 备 存储 器 相 结 合 ， 形 成 一 个 cache 存储 系 
统 。 大 多 数 应 用 能 在 cache 中 得 到 命中 ， 这 好像 为 整个 子 系统 配置 了 一 个 大 容量 、 存 取 速 度 快 
的 存储 器 。 


文献 说 明 


有 关 存 储 器 阵列 的 电路 设计 可 以 查阅 文献 [25]、[48] 和 [108]. 

进一步 了 解 一 个 完整 存储 系统 的 相关 资料 ， 可 查询 Jacob 等 人 所 著 的 文献 【57 ] 。 关 于 存 
储 器 交叉 和 调度 的 更 多 信息 ， 可 查阅 Rau 的 经 典 论文 [92] 和 Bailey 在 文献 [5] 中 有 关 存 储 
体 竞 争 的 研究 。Burroughs 科学 计算 处 理 器 [66] 使 用 了 多 体 交 叉 存 储 器 。 有 关内 存 访问 调度 
的 细节 ， 请 参阅 文献 [94]. 

文献 [47] 详细 描述 了 缓存 对 CPU 性 能 的 影响 。 有 关 一 致 性 方面 的 问题 ， 请 查阅 文献 [29] 。 


习题 
25.1 存储 器 寻 址 。 对 于 下 面 每 个 存储 器 ， 需 要 多 少 位 地 址 才能 对 全 部 容量 进行 寻 址 。 并 解释 哪些 位 分 
别 用 于 选取 字 节 、 选 取 存 储 体 和 选取 字 。 假 设 采用 字 节 寻 址 ， 存 储 体 的 选择 位 与 字 节选 择 位 相 邻 。 
(a) 一 个 容量 为 2000、 字 长 为 32 位 的 阵列 。 
(b) 8 个 位 片 阵列 ， 每 片 容量 为 1000， 字 长 为 16 位。 
(e) 16 个 存储 体 阵 列 ， 每 个 存储 体 容 量 为 512， 字 长 为 128 位 。 
(d) 8 个 存储 体 ， 每 个 存储 体 又 是 由 16 个 位 片 阵列 构成 的 ， 每 个 阵列 容量 为 1000， 字 长 为 64 位 。 
25.2 J Verilog 编写 SRAM。 参 考 图 8-52 中 实现 的 RAM， 编 写 Verilog 代码 实现 以 下 要 求 : 
(a) 8 个 位 片 阵列 形成 一 个 存储 器 ， 每 片 容量 为 1024， 字 长 为 16 位。 
(b) 16 个 存储 体 阵 列 形 成 一 个 存储 器 ， 每 个 存储 体 容量 为 5312， 字 长 为 128 位 。 任 一 存储 体 只 有 
在 需要 时 才能 被 激活 。 
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25.3 


25.5 


25.10 


DRAM 时 序 ，I。 假 设 DRAM 的 工作 时 序 为 5-5-5-12。 地 址 是 8 位 ， 高 4 位 为 行 选择 、 低 4 位 为 列 
选择 。 地 址 流 为 01，02，03，10，20，a3，b3，04，bl，b2， 回 答 下 面 的 问题 。 
(a) 总 延迟 是 多 少 ? (必须 启动 和 完成 所 有 行 的 预 充 电 。) 
(b) 自行 安排 请 求 的 顺序 ， 并 重新 计算 延迟 。 
DRAM HÆ, I, XA DRAM 进行 比较 ， 一 个 DRAM 的 IO 时 钟 为 800 MHz， 工 作 时 序 8 -8 - 
8, A— DRAM 的 1/0 时 钟 为 1 GHz， 工 作 时 序 为 12 -8 -8 (这 里 忽略 thas )。 对 于 下 列 访 问 方 
式 ， 哪 个 DRAM Etk? 
(a) 访问 不 同行 的 一 串 随机 地 址 。 
(b) 99% 的 时 间 访 问 同一 行 的 一 串 地址 。 
对 一 个 已 打开 的 行 的 访问 ， 百 分 比 达到 多 少时 能 获得 相同 的 性 能 ? 
跳跃 式 访问 。 访 问 一 个 矩阵 可 以 使 用 行 索 引 r MIRI c。 如 果 矩 阵 按 行 存放 ， 地 址 偏 移 的 基地 址 
是 me +e, HP a, 是 列 数 。 如 果 按 列 存放 ， 访 问 的 偏 移 量 为 "+ mc。 在 一 个 交叉 存储 器 中 ， 如 果 
按 下 面 的 C 代码 进行 访问 ， 如 何 设置 存储 体 〈 假 定 可 以 并 行 访 问 ) : 
for(int i=0; i<nr; i++) { 
for(int j = 0; jenc; j++) í 
sum += m[i] [j]; //i# Rí, JRA 


空间 局 部 性 和 块 的 大 小 。 分 析 一 个 块 大 小 为 1 个 字 (4 5) 的 cache。 经 过 大 量 统计 ， 发 现 如 果 
地 址 a 中 的 字 被 使 用 ， 那 么 地 址 w+4，au+8，…，a+28 中 的 7 个 字 被 使 用 的 概率 己 是 0.95。 也 
就 是 说 ， 如 果 我 们 20 次 中 有 19 次 访问 了 某 一 个 字 ， 也 会 访问 随后 的 7 个 字 。 在 同样 的 工作 量 下 ， 
如 果 我 们 将 cache 的 块 大 小 分 别 增加 到 2 个 字 、4 个 字 和 8 个 字 时 ， 命 中 率 会 有 何 变化 ? 每 一 种 块 
大 小 会 对 内 存 带 宽 有 何 要 求 ? 

组 相 联 映射 。cache 不 一 定 是 全 相 联 映射 或 直接 映射 。 设 计 cache 时 可 以 采用 2，4，…，, u 路 组 相 
联 映射 。 每 个 地 址 可 以 映射 到 w 中 的 任何 一 个 。 设 计 并 绘制 一 个 4 路 组 相 联 cache 的 结构 框图 。 
每 个 地 址 是 32 位 ， 按 字 节 编 址 。cache 块 大 小 是 64 字 节 ,共有 1 024 个 组 (每 组 有 4 路 )。 可 以 只 
使 用 SRAM 阵列 ， 且 必须 在 一 个 周期 内 〈 该 周期 可 能 很 长 ) 完成 访问 。 给 出 所 有 阵列 的 大 小 ， 并 
解释 地 址 中 哪些 位 用 来 访问 阵列 ， 哪 些 用 来 存储 标签 。 

最 坏 情况 下 的 访问 模式 。 对 于 下 面 几 种 cache, 分别 给 出 一 个 最 少数 量 的 访问 地 址 流 ， 且 该 地 址 流 
没有 一 次 能 够 命中 : 

(a) 具有 个 组 的 直接 映射 cache; 

(b) 块 数 为 n 的 全 相 联 cache; 

(c) 一 个 路 的 组 相 联 cache, 

球 和 箱子 问题 。 假 设 有 7 个 存储 体 ， 每 个 存储 体 的 访问 概率 相同 。 平 均 请 求 (E(r)) 的 公式 如 
下 ， 至 少 要 对 每 个 存储 体 做 一 次 请 求 检测 。 


E(r) = sy + (25-2) 
i=l 


(a) HNHH n 的 期 望 函 数 。 

(b) 受到 设计 条 件 的 限制 ， 只 能 构建 一 个 16 输入 的 仲裁 器 。 平 均 情况 下 可 以 有 多 少 存储 体 得 到 充 
分 利用 ? 答案 不 能 是 2 WUT o 

(c) 如 果 是 一 个 256 输入 的 仲裁 器 ,平均 情况 下 有 多 少 存储 体 可 以 达到 最 大 的 吞吐 率 ? 

公平 仲裁 。 用 Verilog 编写 一 个 仲裁 器 ， 该 仲裁 器 可 以 处 理 4 个 高 优先 级 请 求 和 4 个 低 优 先 级 请 

求 ， 并 输出 8 个 授权 信号。 

(a) 编写 一 个 基准 模块 ， 低 优先 级 请 求 可 以 被 “ 饿 死 ”。 

(b) 编写 一 个 模块 ， 每 4 个 高 优先 级 请 求 通过 后 ， 人 允许 1 个 低 优 先 级 请 求 获得 授权 。 对 于 相同 优 
先 级 的 请 求 可 以 采用 一 种 静态 的 平局 决胜 方案 。 

(c) 修改 上 面 的 模块 ， 在 一 个 类 中 通过 循环 方式 实现 平局 决胜 。 也 就 是 说 ，4 个 输入 0 在 授权 前 
具有 最 高 的 优先 级 ， 然 后 是 4 个 输入 1 具有 最 高 优先 级 ， 以 此 类 推 。 
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第 26 章 | 


Digital Design; A Systems Approach 


异步 时 序 电路 





异步 时 序 电路 包含 与 时 钟 不 同步 的 状态 。 与 我 们 已 经 研究 过 的 同步 时 序 电路 一 样 ， 异 步 时 序 
电路 通过 给 实现 次 态 函 数 的 组 合 逻 辑 加 状态 反馈 来 实现 。 与 同步 电路 不 同 的 是 ， 异步 时 序 电 路 的 
状态 改变 可 能 发 生 在 任何 时 刻 。 这 种 将 次 态 变 为 现 态 的 异步 状态 更 新 使 得 设计 过 程 更 加 复杂 。 我 
们 必须 关注 次 态 函 数 中 的 险象 ， 因 为 一 个 瞬时 脉冲 就 有 可 能 导致 错误 的 终止 状态 。 我 们 还 必须 关 
心 在 状态 转换 过 程 中 状态 变量 之 间 的 竞争 ， 因 为 当 超 过 一 个 变量 时 ， 状 态 的 编码 可 以 不 同 。 

在 这 一 章 里 ， 我 们 看 看 异步 时 序 电路 的 基本 原理 。 我 们 从 如 何 通过 画 流 表 来 分 析 带 反馈 的 
组 合 四 辑 开始 ， 流 表 显 示 了 哪些 状态 是 稳定 的 ， 哪 些 是 瞬 态 的 ， 哪 些 是 振荡 的 。 然 后 ， 看 看 如 
何 按照 从 规格 说 明 开 始 画 流 表 ， 然后 化 简 流 表 ， 到 生成 逻辑 表达 式 的 步骤 去 综合 一 个 异步 电 
路 。 我 们 知道 ， 对 异步 时 序 机 而 言 状态 分 配 非常 关键 ,因为 它 决定 了 何 时 可 能 会 产生 潜在 的 苋 
争 。 本 章 还 会 讲 到 通过 引入 瞬 态 可 以 消除 一 些 苑 争 。 

本 章 内 容 介 绍 完 后 ,我 们 会 在 第 27 章 中 以 锁 存 器 和 触发 器 为 例 继续 讨论 异步 电路 。 


26.1 流 表 分 析 


回忆 14.1 节 ， 考 在 组 合 逻辑 周围 加 一 条 反馈 路 径 则 形成 一 个 异步 时 序 电路 ， 如 图 26-1a 所 
示 。 为 了 分 析 这 个 电路 ， 我 们 断 开 其 中 的 反馈 路 径 ， 如 图 26-1b 所 示 ， 写 出 关于 次 态 变量 的 方 
程式 ， 该 方程 式 是 现 态 变量 和 输入 的 函数 。 现 在 ， 当 现 态 变 量变 为 新 值 时 (多 位 任意 变化 ) ， 
我 们 就 可 以 推出 电路 的 变化 情况 。 








图 26-1 异步 时 序 电路 。a) 组 合 罗 辑 加 一 条 传输 状态 信息 的 反馈 路 径 形成 一 个 时 序 电 路 。 
b) 要 分 析 异 步 时 序 电 路 ， 先 断 开 反馈 路 径 ， 再 看 次 态 与 现 态 之 间 的 关系 


首先 ， 这 一 点 与 我 们 在 14. 2 节 讨 论 的 同步 时 序 电 路 相似 。 在 这 两 种 情况 下 ， 我们 都 可 以 
通过 现 态 和 输入 计算 得 到 次 态 ， 不 同 的 是 次 态 变 为 现 态 的 变化 过 程 。 由 于 没有 时 钟 控制 的 状态 
寄存 器 ， 异 步 时 序 电路 的 状态 可 能 在 任 一 时 刻 改 变 (异步 地 )。 当 状态 的 多 位 在 同一 时 刻 改 变 
时 ， 就 会 引起 所 谓 的 竞争 现象 。 多 位 以 不 同 速率 变化 就 会 产生 不 同 的 终 态 。 此 外 ， 同 步 电 路 最 
终 会 到 达 一 个 稳定 状态 ， 在 下 一 个 时 钟 周期 到 来 之 前 ， 次 态 和 输出 不 会 改变 。 而 异步 电路 可 能 
永远 不 会 到 达 稳 定 状 态 ， 甚 至 在 输入 不 变 的 情况 下 会 无 限期 地 振荡 下 去 。 

在 14.1 节 ， 我 们 已 经 看 到 了 一 个 用 这 种 方式 分 析 异 步 电 路 (RS 触发 器 ) 的 例子 。 在 本 

， 我 们 来 看 一 些 其 他 例子 ， 引 入 流 表 这 一 工具 来 分 析 和 综合 异步 电路 。 

看 图 26-2a 所 示 的 电路 ， 图 中 每 个 与 门 都 用 使 其 有 效 的 输入 状态 ab 来 标记 。 例如， 最 上 面 
标记 为 00 的 与 门 ， 当 a 和 为 低 电 平时 有 效 。 为 了 分 析 这 个 电路 ， 我 们 断 开 反馈 环 路 ， 如 
图 26-2b 所 示 。 此 时 ， 我 们 可 以 根据 输入 gc、2 和 现 态 写 出 次 态 函 数 ， 如 图 26-2c 的 流 表 所 示 。 
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图 26-2 异步 时 序 电 路 举例 a) 原始 电路 。b) 断 开 反馈 环 路 的 电路 。e) 次 态 函 数 流 表 ， 带 
圈 的 表 项 是 稳定 状态 


图 26-2c 列 出 了 输入 和 现 态 8 种 组 合 下 对 应 的 次 态 ， 输 入 状态 以 格雷 码 顺序 横向 列 出 ， 现 
态 纵向 列 出 。 如 果 次 态 与 现 态 相 同 ， 在 用 次 态 更 新 现 态 时 不 会 发 生 任何 变化 ， 因 而 该 状态 是 稳 
定 的 。 如 果 次 态 与 现 态 不 同 ， 一 旦 现 态 更 新 为 次 态 ， 电 路 状态 将 会 发 生 改变 ， 因 而 该 状态 是 紧 

例如 ， 当 电路 输入 ab=00， 并 且 现 态 为 0 时 ,次 态 也 为 0， 因 此 这 是 一 个 稳定 状态 ， 如 表 
bret tai 如 果 输 入 5 变 高 ， 即 ab =01， 在 表 中 右 移 一 格 。 此 时 ,与 门 01 有 效 ， 
次 态 为 1。 因 为 现 态 与 次 态 不 同 ， 这 是 一 一 种 不 稳定 的 瞬 变 状态 o 一 段 时 间 以 后 ( 因为 传输 值 的 
改变 ) ， 现 态 将 变 为 1， 在 表 中 下 移 一 格 。 此 时 ， 因为 现 态 和 次 态 都 为 1 所 以 我 们 到 达 了 一 

如 果 在 瞬 态 之 间 循 环 而 没有 出 现 稳 态 ， 则 产生 振荡 。 例 如 ， 当 图 26-2 中 的 电路 输入 ab = 
11 时 ， 次 态 总 是 现 态 的 补 码 ， 在 这 种 输入 状态 下 ， 电 路 永远 是 不 稳定 的 ， 它 将 在 0 与 1 之 间 不 
停 地 振荡 。 我 们 永远 不 希望 出 现 这 种 现象 ， 异 步 电路 的 振荡 几乎 都 是 一 种 错误 。 

那么 ， 图 26-2 的 电路 功能 到 底 是 什么 ? 聪明 的 读者 一 定 已 经 发 现 ， 这 是 一 个 带 振荡 特性 
的 RS 触发 器 。 输 入 a 是 复位 输入 端 ， 当 a 为 高 ,5 为 低 时 ， 次 态 恒 为 0; 当 “ 变 低 后 ， 次 态 变 
为 现 态 ， 此 时 的 次 态 依然 为 0。 相 似 地 ，2 为 置 位 输入 端 ， 当 ”为 高 而 为 低 时 ， 次 态 为 1; 当 
b 变 低 后 ， 次 态 保 持 为 1。 该 触发 器 与 图 14-2 唯一 的 不 同 之 处 在 于 加 了 中 间 的 标示 为 11 的 与 
门 。 当 两 个 输入 均 为 高 时 ， 图 14-2 中 的 电路 复位 ， 而 图 26-2 中 的 电路 因为 加 入 的 与 门 而 产生 
了 振荡 。 如 果 移 除 门 11 和 门 00 的 5 输入 端 ， 该 电路 就 变 成 了 图 14-2 所 示 的 电路 。 

为 了 简化 异步 电路 的 分 析 ， 我 们 特别 规定 电路 操作 应 遵循 以 下 的 基本 工作 方式 限制 : 同一 
时 刻 只 能 有 一 位 输入 改变 ,并且 在 下 一 位 输入 改变 前 电路 必须 达到 稳 态 。 

在 基本 工作 方式 下 操作 的 电路 同一 时 刻 只 需 关心 一 位 输入 的 变化 ， 不 允许 多 位 输入 同时 改 
变 。 触 发 器 的 建立 和 保持 时 间 是 基本 工作 方式 限制 的 实例 ， 触 发 器 的 时 钟 和 输入 数据 不 允许 同 
时 改变 。 输 入 数据 改变 后 ， 在 时 钟 输入 改变 前 ， 电 路 必须 达到 稳 态 (建立 时 间 )。 相 似 地 ， 时 
钟 输入 改变 后 ， 在 输入 数据 改变 前 ， 电 路 必须 达到 稳 态 〈 保 持 时 间 ) 。 在 第 27 章 ， 我 们 会 更 详 
细 地 讨论 在 用 异步 电路 设计 实现 触发 器 时 建立 和 保持 时 间 之 间 的 关系 。 

在 查看 像 图 26-2 所 示 的 流 表 时 ， 用 基本 工作 方式 操作 意味 着 我 们 只 需 考虑 相 邻 方 格 之 间 
的 输入 变化 〈 最 左 列 与 最 右 列 也 相 邻 ) ， 而 不 必 担 心 出 现 输入 从 11 (振荡 ) 到 00 (保持 ) 变 
化 的 情况 。 这 种 情况 不 会 发 生 ， 因 为 同一 时 刻 只 能 有 一 个 输入 变化 ,在 变 到 00 之 前 必须 先 经 
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过 状态 10 (复位) 或 01 ( 置 位 )。 

在 一 些 现 实情 况 下 ， 不 可 能 限制 按照 基本 工作 方式 操作 输入 。 在 这 些 情况 下 ， 我 们 就 需要 
考虑 多 个 输入 的 变化 。 该 问题 超出 了 本 书 的 范围 ， 感 兴趣 的 读者 可 以 参考 本 章 后 面 列 出 的 文献 
目录 。 


26.2 流 表 综合 : 触发 电路 
现在 ,我 们 明白 了 如 何 使 用 流 表 来 分 析 异 步 电 路 的 行为 ， 即 对 于 给 定 的 一 张 原理 图 ， 可 以 

通过 画 流 表 来 理解 电路 的 功能 。 在 本 节 中 ， 我们 将 在 其 他 方面 使 用 流 表 。 我 们 会 看 到 如 何 根据 

电路 设计 规格 创建 流 表 ， 然 后 使 用 流 表 综 合 出 可 以 实现 设计 规格 的 电路 原理 图 。 
来 考虑 触发 电路 的 设计 规格 ， 如 图 26-3 所 

示 。 该 电路 有 一 个 输入 in 和 两 个 输出 at b? l 

4 in 为 低 时 ， 两 个 输出 均 为 低 。 当 in 第 一 次 = 触发 器 

变 高 时 ， 输 出 a 变 高 ， 当 in 出 现下 一 个 上 升 跳 b 

变 时 ,输出 6b 变 高 ; E in 的 第 三 个 上 升 沿 ，a 

再 次 变 高 ， 该 电路 就 是 这 样 不 断 地 操纵 in 上 的 in 


A 一 一 re A 
综合 触发 电路 的 第 一 步 是 写 出 流 表 , 可 以 b 


直接 从 图 26-3 的 波形 图 得 到 。 输 入 的 每 一 个 变 ea pw 网 
化 都 可 能 是 一 个 新 状态 ， 因 此 我 们 可 以 将 波形 — OO sa 
图 划分 成 不 同 的 状态 ， 如 图 26-4 所 示 。 我 们 从 

状态 A 开始 ,在 in 的 上 升 沿 进入 状态 B， 此 时 输出 a 变 为 高 ， 在 in 的 下 降 沿 进入 状态 C。 即 使 
C 与 A 输出 相同 ， 但 因为 in 的 下 一 次 变化 会 产生 不 同 的 输出 ， 所 以 也 把 它们 看 作 不 同 的 状态 。 
fE in 的 第 二 个 上 升 沿 进入 状态 D， 输 出 5 变 为 高 。 当 in 再 次 变 低 时 ， 返 回 到 状态 A。 之 所 以 认 
为 该 状态 与 状态 A 相同 ， 是 因为 此 时 在 所 有 可 能 的 输入 下 ， 电 路 的 行为 都 无 法 与 起 始 状态 A 
相 区 分 。 








图 26-4 电路 的 输入 每 变化 一 次 就 创建 一 个 新 状态 ， 直 到 电路 明显 回 到 已 有 的 状态 ， 这 样 就 
从 触发 电路 的 设计 规格 创建 了 一 个 流 表 


得 到 了 触发 电路 的 流 表 ， 下 一 步 是 为 每 一 个 状态 指定 一 个 二 进 制 编码 。 这 里 的 状态 分 配 比 
同步 机 的 更 关键 ， 如 果 两 个 状态 X 和 并 有 一 个 以 上 的 状态 位 不 同 ,， 那么 在 X 变 为 Y 之 前 需要 
先 改变 一 个 状态 位 ， 从 而 使 其 到 达 一 个 肯 态 。 在 某 些 情况 下， 两 个 状态 位 可 能 会 产生 竞争 ， 我 
们 将 在 第 26. 3 节 详 细 讨论 竞争 。 此 处 ， 我 们 挑选 如 图 26-5a 所 指定 的 状态 分 配 ， 每 一 个 状态 转 
换 仅 有 一 位 状态 位 变化 。 

状态 分 配 后 ， 触 发 电路 的 实现 就 是 一 个 简单 的 组 合 逻 辑 生成 的 问题 了 。 我 们 将 流 表 重 画 成 


加 ”实际 中 还 要 求 有 一 个 复位 输入 rst 来 初始 化 电路 状态 。 


FOF APNABI 395 








如 图 26-5b 所 示 的 卡 诺 图 ， 该 卡 诺 图 展示 了 符号 化 的 次 态 函数 ， 每 一 个 方 格 列 出 了 在 输入 和 现 
态 下 的 次 态 名 称 (从 A 到 D) ， 箭 头 显示 了 电路 操作 中 状态 依次 变化 的 路 径 ， 了 解 该 路 径 对 于 
避免 竞争 和 冒险 非常 重要 。 我 们 参考 这 张 用 轨迹 图 表现 状态 转换 的 卡 诺 图 ， 是 因为 它 展示 了 状 
态 变 量 的 轨迹 。 





图 26-5 根据 流 表 实现 触发 电路 。a) 指定 了 状态 分 配 的 流 表 。b) 流 表 映射 到 卡 诺 图 。 
e) 次 态 编码 映射 到 卡 诺 图 。d) so 的 卡 诺 图 。e) s 的 卡 诺 图 


我 们 用 二 进 制 编码 代替 状态 名 称 重 绘 卡 诺 图 ， 结 果 如 图 26-5c 所 示 。 将 该 图 拆 分 成 两 张 图 
分 别 表 示 状 态 变量 s。 和 s, ， 如 图 26-5d 和 图 26-Se 所 示 。 我 们 从 这 些 卡 诺 图 可 以 得 到 下 列 关 于 
Sy Als, 的 表达 式 : 
s = (a, Ain) V (as A in) V (sa A 5.) (26-1) 
s, = (s, Ain) V (s, A in) V (s A s.) (26-2) 
上 面 的 表达 式 要 求 必 须 包 括 最 后 一 个 殖 涵 项 ， 用 以 避免 险象 的 发 生 。 如 果 不 沿 着 输入 / 状 
态 路 径 操作 ,异步 电路 一 定 会 发 生 险 象 。 这 是 因为 现 态 不 断 地 被 反馈 回去 ， 状 态 转换 过 程 中 的 
任何 一 个 干扰 都 会 导致 电路 切换 到 不 同 的 状态 ， 从 而 无 法 实现 想 要 的 功能 。 例 如 ， 假 设 我 们 将 
I s As ARER (26-2) 中 去 掉 。 当 in 在 状态 B ARR, TEs 变 高 前 ，s 可 能 暂时 变 低 。 此 
时 ， 两 个 表达 式 的 中 间 项 均 为 假 ，s, 就 不 会 变 高 一 一 电路 进入 状态 A， 而 不 是 状态 C. 
完成 综合 的 最 后 一 步 是 写 出 输出 表达 式 。 在 状态 01 时 输出 a WAL, 在 状态 10 时 输出 为 
真 ， 因 此 ， 表 达 式 如 下 : 
a=5 À s (26-3) 
b = s, Assy. (26-4) 
例 26-1 3 分 频 电路 
设计 一 个 异步 时 序 电路 ， 输 入 为 a， 输 出 为 g， 要 求 输入 a 每 变化 3 次 ， 输 出 9 变化 1 次 。 
该 电路 的 波形 如 图 26-6 所 示 ， 图 中 标 出 了 每 个 异步 状态 的 名 称 。 从 波形 图 直接 可 得 到 如 
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图 26-7 所 示 的 流 表 。 该 流 表 第 二 列 是 为 grs 指定 的 状态 分 配 ， 我们 将 输出 g 作为 其 中 一 个 状态 
变量 ， 再 加 上 两 个 额外 的 变量 r 和 s AK E 232 6 种 状态 ， 相 邻 状 态 之 间 仅 有 一 个 状态 变量 变化 ， 


这 样 分 配 可 以 避免 竞争 的 发 生 。 
, = SA 
HAS A B C D E F A B 


B 26-6 例 26-1 所 设计 的 3 分 频 异 步 电路 的 波形 图 


如 图 26-8 所 示 ， 使 用 状态 分 配 画 出 轨迹 图 和 每 个 状态 
变量 的 卡 诺 图 。 从 卡 诺 图 中 我 们 可 以 标 出 主 冀 涵 项 ， 写 出 
每 个 状态 变量 的 逻辑 表达 式 。 我 们 小 心地 党 轨迹 履 盖 所 有 
的 状态 变化 以 避免 临界 险象 ， 有 意思 的 是 ， 这 三 个 状态 变 
量 都 可 以 用 一 个 多 输入 门 来 实现 。 其 表达 式 如 下 : 

q=(qAr)V(qAa) V (G Ar), 
Pm (p A a) V CA a) V Cs Aa), 
s = (s Aq) V (s A ay V Çq Á ay. 

Lik kik XH Verilog 模块 实现 如 图 26-9 所 示 ， 我 们 图 26-7 例 26-1 所 设计 的 3 分 频 异 步 

增加 了 复位 信号 rst 来 初始 化 状态 变量 。 电路 状态 转换 流 表 








26-8 例 26-1 所 设计 的 3 分 频 电路 的 轨迹 图 a) 和 每 个 状态 变量 的 卡 诺 图 b) ~d) 





module Div3(rst,a,q) ; 
input rst,a ; 
output q ; 
wire rr, 8 ; 





assign q = “rst &((~r & q)| (Cr & a)|(q & a)) ; 

assign r = “rst &(( s & a)|( s & r)|(a&r)) ; 

assign s = “rst &((s & ~a)|(s & q)|(q & ~a)) ; 
endmodule//Div3 





E 26-9 = fyi] 26-1 所 设计 的 3 分 频 电路 的 Verilog 实现 


Verilog 模块 的 仿真 波形 如 图 26-10 所 示 。 除 了 状态 变量 4 产生 了 3 分 频 波形 , r 和 s 也 产生 
了 相 移 半 周 期 的 3 分 频 波形 。 这 样 就 得 到 了 一 个 三 相 发 生 器 电路 。 
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FA 26-10 fi] 26-1 的 3 分 频 Verilog 模块 的 仿真 波形 


26.3 竞争 与 状态 分 配 


我 们 以 图 26-11a 所 示 的 触发 电路 的 另 一 种 状态 分 配 为 例 来 说 明 多 个 状态 变量 同时 变化 的 
问题 。 此 处 ， 我 们 把 两 个 输出 a 和 4b 看 作 状 态 变 量 ， 再 增加 一 个 状态 变量 < 用 来 区 别 状 态 A 和 
C， 得 到 图 中 所 示 的 编码 。° 

对 于 这 种 状态 分 配 ， 当 状态 A (cab =000) 变 为 状态 B (110) BF, 变量 c Ala 都 要 变 。 如 
果 按 这 种 逻辑 进行 设计 ， 在 状态 A 下 ， 当 in 变 高 时 ，c 和 都 变 高 ， 但 变化 的 顺序 可 以 是 任意 
的 ， 可 以 是 变量 a 先 变 ， 也 可 以 是 变量 先 变 ， 也 可 以 两 个 同时 变 。 如 果 两 个 同时 变 ， 则 可 以 
直接 从 状态 A 变 到 状态 B， 不 会 出 现 中 间 的 状态 。 如 果 a 先 变 ， 则 先 会 到 未 分 配 的 状态 010, 
然后 如 果 状 态 010 不 符合 逻辑 ， 则 进入 状态 110, WE c 先 变 ， 则 进入 状态 C (100) ， 此 时 输 
人 为 高 ， 驱 动 电路 进入 状态 D。 显 然 ， 不 能 允许 e 先 变 。 这 种 多 个 变量 可 以 同时 变化 的 情况 叫 
竞争 。 状 态 变量 通过 竞争 决定 哪个 变量 先 变 ， 如 果 竞 争 的 结果 改变 了 最 终 的 状态 (ABI), 
我 们 称 这 种 竞争 为 临界 竞争 。 

为 了 避免 a 和 < 同时 变化 所 产生 的 临界 竞争 ， 我 们 对 次 态 函数 进行 限制 ， 在 状态 A 仅 允 许 
a 变化 ， 从 而 到 达 瞬 态 010 ， 我 们 称 其 为 B1 。 当 电路 到 达 状 态 Bl 时 ， 次 态 逻 辑 使 得 e 变化 。 

图 26-11b 的 轨迹 图 说 明了 瞬 态 的 引入 。 在 状态 A， 当 输入 变 高 时 ， 次 态 函 数 指向 状态 BL, 
而 不 是 B。 这 相当 于 只 有 一 个 变量 改变 ， 即 a 变 高 ， 从 而 到 达 状 态 B， 如 图 中 向 下 的 箭头 所 示 。 
在 状态 BL 不 允许 c 改变， 以 避免 横向 变换 到 标 为 Dl 的 方 格 。 一 旦 电路 到 达 状 态 Bl, KAK 
数 变 为 B， 使 得 c 改变 ， 从 而 横向 变换 到 稳 态 Bo 





图 26-11 触发 电路 的 男 一 种 状态 分 配 ， 要 求 在 一 次 状态 转换 中 有 多 个 状态 变量 变化 。 
a) 修改 了 状态 分 配 的 流 表 。b) SIA T BRAS B1 =010 和 D1 =101 的 轨迹 图 


从 状态 C 100 转换 到 状态 D001， 变量 c 和 4 都 发 生 改 变 ， 因 而 也 需要 引入 瞬 态 。 如 果 变 量 
c 先 变 ， 不 受 控制 的 竞争 最 终 会 将 电路 稳定 在 状态 B 110， 这 是 不 正确 的 。 为 了 防止 该 竞争 的 
发 生 ， 在 状态 C， 当 in 变 高 时 我 们 仅 允 许 b 改变， 从 而 进入 瞬 态 DI (110)。 一 旦 进入 状态 


日 ”注意 : 编码 的 位 序 为 <，a,b。 


[540] 
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就 可 以 允许 c 变 低 ， 从 而 进入 状态 D (001). 

图 26-12 展示 了 修改 后 的 触发 电路 的 实现 过 程 。 图 26-12a 是 次 态 函 数 的 卡 诺 图 ， 卡 诺 图 的 
每 一 个 方 格 列 出 了 现 态 和 输入 下 次 态 的 编码 。 注 意 ， 如 果 次 态 等 于 现 态 ， 则 该 状态 是 稳定 的 。 
瞬 态 Bl (010， 位 于 对 角 线 上 的 第 二 格 ) 是 不 稳定 的 ， 因 为 它 的 次 态 是 110。 

从 次 态 卡 诺 图 可 以 得 到 每 个 状态 变量 各 自 的 卡 诺 图 ， 图 26-12b ~ 图 26-12d 分 别 展示 了 变 
Ba, b 和 * 的 卡 诺 图 。 注 意 ， 状 态 轨迹 图 中 未 标 出 的 状态 〈 图 26-12a 中 的 空白 方 格 ) 不 用 关 
心 。 因 为 电路 永远 不 会 进入 这 些 状 态 ， 所 以 我 们 不 用 关心 未 访问 的 次 态 。 

从 这 些 卡 诺 图 得 到 以 下 的 状态 变量 表达 式 : 


a=(inAbAc) V (in Aa) (26-5) 
b = (in Aa Ac) V (in A b) (26-6) 
341 c=aV(bAc) (26-7) 





图 26-12 用 图 26-11 a 所 示 的 另 一 种 状态 分 配 实现 触发 电路 。a) ERT c. b. a 三 位 次 
态 函 数 的 卡 诺 图 。b) a 的 卡 诺 图 。e) b 的 卡 诺 图 。d)c 的 卡 诺 图 


注意 ,我 们 不 需要 再 单独 列 出 输出 变量 的 表达 式 ， 因 为 a 和 ,既是 状态 变量 也 是 输出 变量 。 


例 26-2 独 热 触发 电路 

采用 独 热 状态 分 配 设计 一 个 触发 电路 ， 描 述 如 何 解决 所 有 潜在 的 竞争 。 

使 用 输出 a 和 6b 作为 独 热 变量 ,分 别 代 表 状 态 B 和 了 。 再 增加 两 个 状态 变量 r fos, DAR 
表 状 态 A 和 C。 因 此 ,得 到 的 状态 为 bsar， 状 态 分 配 为 A=0001, B=0010, C=0100, D = 
1000。 每 次 状态 变换 有 两 个 状态 变量 需要 变化 ， 会 引发 4 种 潜在 的 竞争 。 

独 热 触发 电路 的 五 变量 转换 图 如 图 26-13 所 示 。 在 状态 A =0001 下 ， 当 in 变 高 时 ， 电 路 直 
接 转换 到 瞬 态 B1 =0011， 然 后 切换 到 状态 B=0010。 此 处 的 完整 状态 (加 上 in) 变化 顺序 是 : 
fin, A} (00001), lin, A} (10001), lin, B1} (10011), lin, B} (10001)。 注 意 ， 此 处 我 们 
可 以 允许 产生 竞争 ， 即 允许 通过 Bl (0011) 或 B2 (0000) 完成 状态 转换 ,但 我 们 并 没有 这 么 

[542] 做 。 其 他 情况 我 们 将 在 习题 26-12 ~ 习题 26-15 中 讨论 。 
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in=0 in=1 
图 26-13 f|26-2 独 热 触发 电路 的 五 变量 状态 转换 图 


在 状态 B， 当 in 变 低 时 ， 首 先 变 为 Cl1 =0110， 然 后 变 为 C=0100。 其 实 ， 我 们 可 以 选择 允 
许 竞争 ， 即 通过 Cl 或 C2 = 0000 变 为 C， 但 我 们 并 未 这 样 做 。 注 意 ，C2 = 0000 与 B2 = 0000 并 
不 冲突 ， 因 为 C2 Z in 为 低 时 的 瞬 态 , 而 B2 是 in 为 高 时 的 瞬 态 ， 换 向 话 说 ，C2 的 完整 状态 
(输入 和 内 部 状态 ) Z 0000, 而 B2 的 完整 状态 是 10000。 

相似 地 ， 我 们 强制 要 求 通过 D1 =1100 ZAA C F D HHR, A, AMTUAAFES, 
即 通 过 Dl 或 者 B2 进行 转换 ， 但 前 提 是 不 允许 转换 为 状态 了 B 的 竞争 ， 因 为 B2 只 能 转换 为 D 或 
B 其 中 之 一 。 

最 后 ， 我 们 要 求 通过 Al =1001 实现 从 站 到 A 的 转换 。 我们 可 以 允许 竞争 ， 通 过 Al 或 C2 
完成 转换 ， 但 前 提 是 不 允许 到 状态 CHEF. 

4 个 状态 变量 的 卡 诺 图 如 图 26-14 所 示 。 





K 26-14 例 26. 2 为 得 到 4 个 状态 变量 的 逻辑 表达 式 而 绘制 的 卡 诺 图 
从 这 些 卡 诺 图 可 以 写 出 状态 变量 的 逻辑 表达 式 ， 如 下 : 
r=(bA in) V (r Aa) 
a = (r Ain) V (a A s) 
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s= (aA in) V (s Ab) 
b = (s Ain) V (b Ar) 
这 些 逻 辑 表达 式 有 很 好 的 对 称 性 ， 每 一 个 独 热 状态 变量 都 可 以 用 一 个 RS 触发 器 实现 。 表 
达 式 的 第 一 项 是 set 项 ， 当 前 一 个 状态 变量 置 位 ， 并 且 输 入 切换 到 合适 的 状态 时 ， 该 状态 变量 
置 位 。 表 达 式 的 第 二 项 都 为 reset 项 ， 当 下 一 个 状态 变量 置 位 时 ， 该 状态 变量 清 零 。 
一 般 的 独 热 异步 电路 都 可 以 用 相似 的 方式 来 实现 。 对 于 任 一 状态 变量 x， 每 一 个 到 该 状态 
的 转换 都 对 应 一 项 ， 用 set 表达 式 S 来 表示 ， 而 紧 接 着 出 现 的 状态 用 reset $R RAT, 44] x 
的 表达 式 如 下 : 
*=SV(xA XR) (26-8) 
也 就 是 说 ， 对 应 于 变量 x*， 所 有 到 状态 X 的 转换 都 使 x 置 位 ， 而 紧 接 着 的 下 一 个 状态 则 将 x 清 
零 。 这 些 规 则 仅 适用 于 异步 状态 机 ， 其 最 小 的 周期 至 少 包 括 三 个 状态 。 


小 结 


本 章 了 解 了 如 何 分 析 和 设计 异步 时 序 电 路 ， 这 种 带 状 态 反 馈 的 逻辑 电路 不 会 受到 时 钟 控制 
的 存储 元 件 的 干扰 。 异 步 电路 中 的 每 个 状态 变量 可 能 在 任意 时 刻 以 任意 顺序 改变 ， 这 就 导致 了 
变量 之 间 竞 争 的 产生 。 为 了 确保 电路 功能 正确 ， 必 须 小 心 所 有 竞争 可 能 出 现 的 结果 。 

流 表 用 于 设计 和 分 析 异 步 时 序 电路 。 流 表 只 是 一 个 状态 表 ， 列 出 了 次 态 ( 带 断 开 的 反馈 回 
路 ) ， 次 态 是 现 态 和 输入 的 函数 。 其 中 ， 次 态 与 现 态 相同 的 是 稳 态 ， 带 圈 。 

一 个 电路 某 一 时 刻 至 多 只 有 一 个 输入 改变 ， 则 称 其 服从 了 基本 工作 方式 的 设 定 。 一 位 输入 
改变 后 ， 在 电路 到 达 稳 态 前 不 允许 输入 变化 。 该 设 定 将 流 表 中 的 横向 转换 限制 在 了 仅 涉 及 一 个 
输入 的 情况 下 ， 从 而 简化 了 分 析 。 

除了 要 特别 注意 状态 分 配 以 避免 竞争 ， 异 步 时 序 电路 的 综合 与 同步 电路 相似 。 我 们 从 将 设 
计 规 格 转换 为 流 表 开始 ， 接 着 生成 状态 分 配 ， 该 分 配 避 免 多 个 状态 位 同时 改变 。 这 里 可 能 要 求 
增加 新 的 皮 态 。 最 后 ， 生 成 用 于 产生 次 态 函 数 的 逻辑 。 重 要 的 是 ， 沿 着 流 表 中 可 能 的 状态 变换 
轨迹 ， 该 逻辑 不 会 出 现 险 象 。 

当 我 们 需要 一 个 异步 电路 时 ， 很 少 有 人 将 流 表 的 分 析 与 综合 当 作 一 项 宝贵 的 技术 来 用 。 通 
常 ， 没 有 这 项 技术 的 工程 师 亡 图 用 一 种 特别 的 方式 来 设计 像 触发 模块 这 样 的 电路 。 他 们 将 用 时 
钟 边 沿 控制 的 触发 器 和 锁 存 器 与 各 类 门 拼凑 在 一 起 ， 其 结果 最 好 的 情况 下 也 是 令 人 失望 的 ， 且 
经 常 是 灾难 性 的 。 理 解 了 流 表 和 竞争 ， 你 就 能 搭建 运行 可 靠 的 高 效 的 异步 电路 了 。 


文献 说 明 

很 多 早期 的 计算 机 的 设计 都 是 完全 异步 的 ， 如 ORDVAC [75] 和 ILLIAC H [15], 但 是 ， 
随 着 时 间 的 推移 ， 同 步 设 计 以 其 简单 而 最 终 胜 出 。 几 乎 所 有 当代 的 数字 系统 主要 部 分 都 是 同步 
的 ， 只 是 为 了 满足 一 些 特殊 情况 而 包含 了 异步 设计 。Ivan Sutherland 在 图 灵 奖 上 的 演讲 [99] 
对 异步 逻辑 提出 了 一 项 有 趣 的 观点 。 对 异步 设计 的 研究 仍 在 继续 ， 在 每 年 的 IEEE 国际 异步 电 
路 与 系统 研讨 会 上 都 有 相关 的 报道 。 这 一 专题 的 文章 还 包括 
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习题 
26.1 原理 图 分 析 。 写 出 图 26-15 中 原理 图 的 流 表 ， 说 明 电 路 的 
功能 。 


26.2 综合。 一 个 相位 比较 器 有 两 个 频率 相同 的 输入 信号 ， 它 将 “图 26-15 习题 26. 1 的 原理 图 
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这 两 个 输入 变换 为 一 个 电压 输出 ,该 电压 指示 了 两 个 输入 信号 同 相 (对 齐 ) 的 程度 。 本 问题 探讨 
该 设计 的 数字 部 分 。 设 该 基本 相位 比较 器 有 两 个 输入 a 和 20， 有 两 个 输出 4 和 B， 写 出 流 表 。 初 始 
状态 是 4=B=0， 当 a 出 现 上 升 沿 时 ， 输 出 要 么 从 (AB) 00 变 为 10， 要 么 从 01 变 为 00， 最 后 稳 
定 到 其 他 的 状态 。 当 4 出现 上 升 沿 时 ， 要 么 从 10 变 为 00， 要 么 从 00 变 为 01。 从 流 表 综 合 出 门 级 
电路 。 该 设计 的 模拟 部 分 是 将 4 或 B 高 电 平 的 时 间 转 化 为 电压 幅 值 。 

触发 综合 。 综 合 触发 电路 ， 其 状态 B 的 编码 为 cab =010， 其 余 的 状态 分 配 如 图 26-11a 所 示 。 
边沿 触发 。26.2 节 的 触发 电路 是 一 个 脉冲 触发 电路 , 该 电路 的 输入 脉冲 交替 出 现在 两 个 输出 上 。 
本 习题 要 设计 一 个 边沿 触发 电路 ,该 电路 输入 信号 的 边沿 触发 两 个 输出 交替 出 现 边 沿 。 该 电路 的 
波形 如 图 26-16 所 示 。 


in 
a 
b 


图 26-16 习题 26.4 的 波形 图 


三 路 触发 。 设 计 一 个 如 26. 2 节 所 示 的 触发 电路 ， 要 求 输入 脉冲 在 三 个 输出 上 交替 出 现 。 

三 路 边沿 触发 。 修 改 习 题 26. 4 的 边沿 电路 ， 使 得 三 路 输出 交替 出 现 边沿 。 

3 分 频 电 路 。 使 用 下 面 的 状态 分 配 再 次 实现 例 26-1 的 3 分 频 电 路 : A =000, B=100, C=110, 
D=111, E=011, F=001, 

5 分 频 电 路 。 设 计 一 个 与 例 26-1 的 3 分 频 电路 相似 的 5 分 频 异 步 电 路 ， 要 求 输入 每 变化 5 次 ， 输 
出 改变 工 次 。 

半 3 分 频 电 路 。 设 计 一 个 电路 ， 它 有 两 个 正 交 输入 上 和 49 (两 输入 的 占 空 比 为 50% ， 且 相位 差 为 
90 BF), ， 有 一 个 输出 x, i 和 9g 合 起 来 每 变化 3 次 , x 变化 1 次 。 电 路 行为 说 明 如 图 26-17 所 示 。 


i 
q 


x 
图 26-17 习题 26.9 的 波形 图 


状态 化 简 。 写 出 触发 电路 的 流 表 ， 但 是 这 次 要 为 in 的 每 8 次 变化 的 第 一 次 创建 一 个 新 的 状态 ， 然 
后 确定 哪些 状态 相当 于 将 该 流 表 化 简 为 了 四 状态 表 。 

竞争 。 设计 一 个 电路 ， 当 输入 c 为 高 时 ， 使 用 标准 二 进 制 计 数 法 从 0 计 到 4 (然后 回 到 0， 如 此 
循环 ) WMR e 为 低 ， 电 路 状态 保持 不 变 。 在 第 一 次 实现 时 ((a) 部 分 ) 忽略 所 有 的 数据 竞争 ; 
(b) 部 分 ， 列举 所 有 可 能 的 竞争 和 潜在 的 错误 的 状态 序列 。 

独 热 触发 ，I。 写 出 例 26-2 的 独 热 触 发 电路 的 逻辑 表达 式 ， 要 求 从 A 到 B 的 转换 允许 竞争 。 

独 热 触发 ，I。 写 出 例 26-2 的 独 热 触发 电路 的 逻辑 表达 式 ， 要 求 从 B 到 C 的 转换 允许 竞争 。 

独 热 触 发 ， [I。 写 出 例 26-2 的 独 热 触发 电路 的 逻辑 表达 式 ， 要求 从 A 到 B 和 从 DD 到 A 的 转换 允 
许 竞争 。 

独 热 触发 ，IV。 例 26-2 的 独 热 触发 电路 可 以 同时 允许 从 A 变 到 B 和 从 C 变 到 D 的 竞争 吗 ? 如 果 
可 以 ， 写 出 该 情况 下 电路 的 逻辑 表达 式 ; 如 果 不 行 ， 请 阐述 原因 。 
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触发 器 是 现代 数字 系统 中 最 关键 的 电路 之 一 。 正 如 我 们 在 前 面 的 章节 所 看 到 的 ， 触 发 融 是 
所 有 异步 时 序 罗 辑 的 核心 。 寄 存 器 〈 由 触发 器 组 成 ) 使 所 有 有 限 状 态 机 的 状态 (包括 控制 和 
数据 状态 ) 得 以 保持 。 除 了 在 逻辑 设计 中 的 中 心 作 用 ， 触 发 器 也 消耗 了 典型 数字 系统 一 大 部 分 
的 死 区 、 功 率 和 周期 。 

直到 现在 ， 我 们 仍 把 触发 器 看 作 一 个 黑 盒 子 。” 在 本 章 中 ， 我 们 研究 触发 器 的 内 部 工作 方 
式 ， 得 出 典型 D 触发 器 的 逻辑 设计 ， 看 看 第 15 章 所 介绍 的 时 序 特性 是 如 何 从 中 产生 的 。 

首先 ， 我 们 赁 直觉 随意 设计 一 个 触发 器 。 从 设计 锁 存 器 开始 ， 直 接 按照 设计 规格 实现 。 然 
后 ， 从 这 个 实现 的 电路 得 到 锁 存 器 的 建立 、 保 持 和 延迟 时 间 。 接 着 ， 我 们 就 可 以 看 到 如 何 将 两 
个 锁 存 器 按 主 从 方式 组 合 起 来 形成 一 个 触发 器 。 从 这 个 触发 器 的 实现 就 可 以 得 到 其 时 序 特性 。 

在 这 种 不 规范 的 设计 之 后 ， 我 们 使 用 流 表 综合 来 得 出 锁 存 器 和 触发 器 的 设计 。 这 样 做 既 有 
利于 增强 这 些 存储 元 件 的 性 能 ， 又 为 流 表 综合 提供 了 一 个 好 的 实例 。 在 推导 过 程 中 ,我 们 引入 
状态 等 价 的 概念 。 一 般 的 读者 可 以 跳 过 这 个 规范 的 推导 过 程 。 


27.1 锁 存 器 的 内 部 结构 


锁 存 器 的 原理 图 符号 如 图 27-1a 所 示 ， 图 27-1b 所 示 的 波形 说 明了 其 行为 和 时 序 。 一 个 锁 
存 器 包括 两 个 输入 一 一 数据 d 和 使 能 信号 8， 还 有 一 个 输出 9。 当 使 能 输入 为 高 时 ， 输 出 随 着 
输入 变化 ; 当 使 能 输入 为 低 时 ， 输 出 保持 当前 的 状态 不 变 。 
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a) b) 
图 27-1 锁 存 器 : a) 原理 图 符号 ; b) 显示 了 时 序 特 性 的 波形 图 


如 图 27-1b 所 示 ， 像 触发 器 一 样 ， 锁 存 器 也 有 建立 时 间 1, 和 保 sg 一 4 
持 时 间 6。 为 了 正确 地 存储 输入 值 ， 在 使 能 信号 下 降 前 ， 输 入 信号 
必须 建立 1.， 在 使 能 信号 下 降 后 ， 输 入 要 保持 ,。 锁 存 器 延迟 包括 
从 使 能 信号 上 升 沿 到 输出 改变 之 间 的 延迟 ke 和 从 输入 数据 改变 到 
输出 改变 之 间 的 延迟 to。。 对 于 主要 控制 延迟 的 使 能 信号 而 言 ， 在 
使 能 信号 上 升 前 ,输入 必须 至 少 建立 i,。 通 常 ， 这 只 是 哪个 信号 f I 
(d RA z) 在 关键 路 径 上 的 问题 ， 且 4， = tu - to。 正如 我 们 下 面 图 27-2 锁 存 器 的 卡 诺 图 
将 要 看 到 的 ， 从 锁 存 器 的 逻辑 设计 可 以 得 到 这 些 时 间 ， 而 且 触 发 器 的 操作 也 需要 满足 基本 工作 
方式 限制 (26.1 节 ) 。 








四” 黑 盒子 是 一 个 系统 ， 我 们 可 以 了 解 其 外 部 规格 ， 但 却 看 不 到 内 部 实现 ， 就 好 像 将 这 个 系统 放 在 了 一 个 不 透明 
的 (黑色 的 ) 盒子 里 ， 使 我 们 无 法 看 到 它 是 如 何 工作 的 。 








a) 
127-3 JEK BFAR RE: a) 使 用 与 门 和 或 门 实现 ; b) 仅 使 用 CMOS 反 相 门 实现 
从 锁 存 器 的 描述 我 们 可 以 写 出 下 面 的 多 辑 表 达 式 : 
q = (g Ad) V (g Aq) (27-1) 
Xg HAH, q = d, 4g 为 假 时 ，9 的 状态 保持 (q =g)， 这 差不多 都 是 对 的 。 但 是 正如 从 
图 27-2 的 卡 诺 图 中 所 看 到 的 ， 当 d 和 49 AR, Ae 的 状态 改变 时 ， 有 可 能 产生 险象 。 为 了 消除 
这 一 险象 ， 必 须 给 表达 式 额 外 增加 一 个 蕴涵 项 ， 如 下 : 
q= (gMd)V (gMAg)V (dq) (27-2) 
从 表达 式 (27-2) 可 以 画 出 锁 存 器 的 门 级 原理 图 ， 如 图 27-3a 所 示 。 如 此 实现 的 锁 存 器 用 
其 最 初 设计 者 的 名 字 命名 为 厄 尔 锁 存 器 (Earle latch) 。 我 们 可 以 仅 用 反 相 门 (一 个 反 相 器 和 4 
个 与 非 门 ) 重新 画 出 厄 尔 锁 存 器 的 CMOS 实现 ， 如 图 27-3b 所 示 。 
现在 ， 从 图 27-3 的 原理 图 可 以 得 到 锁 存 器 的 时 序 特性 。 记 图 中 门 Ui 的 延迟 为 1， (实际 中 ， 
我 们 可 以 像 5.4 节 所 描述 的 那样 计算 出 这 些 门 的 延迟 )， 这些 延迟 因 状 态 和 上 升 下 降 沿 的 不 同 
而 不 同 。 首 先 考虑 建立 时 间 t,.。 为 了 满足 基本 工作 方式 限制 , 输入 d 改变 后 ,在 输入 g 下 降 
前 ， 必 须 允 许 电路 到 达 一 个 稳定 的 状态 。 为 了 使 电路 达到 稳 态 ， 在 g 下 降 前 ，d 的 变化 (上升 
或 下 降 ) 必须 顺序 通过 门 U4、U5 和 U3 进行 传送 ,而 且 状 态 变 量 g 和 门 U3 的 输出 也 都 必须 到 
达 稳 态 。 因 此 这 一 延迟 ， 即 建立 时 间 ， 可 由 下 式 计算 得 到 
t St #2, +2, (27-3) 
建立 时 间 的 计算 表现 了 异步 电路 分 析 的 一 些 精妙 之 处 。 有 人 可 能 会 认为 ， 因 为 d 直接 连 到 
了 U3， 所 以 d 到 U3 的 输出 应 该 是 直 连 的 ， 即 d 到 U3。 但 是 ， 当 d 为 低 时 ， 情 况 却 并 非 如 此 。 
如 果 d 为 低 ， 且 电路 是 稳定 的 ， 则 g AIK. RE, Sd 升 高 时 ， 由 于 U3 的 另 一 个 输入 4 仍 为 
低 ， 所 以 U3 不 能 打开 。 在 U3 打开 前 ，d 的 变化 必须 通过 U4 和 U5 传送 ， 从 而 使 4 为 高 。 因 
此 ,使 电路 稳定 的 路 径 是 从 d 到 U4 到 US 再 到 UZ, 
现在 来 看 保持 时 间 。g 下 降 后 , (Ed 再 次 变化 前 ， 电 路 必须 再 次 回 到 稳 态 。 特 别 地 ， 如 果 
d 为 高 ， 在 允许 d 下降 前 ，g 的 变化 必须 通过 Ul 和 U2 传输 ， 从 而 使 能 U2 和 US 组 成 的 环 路 。 
因此 ， 保 持 时 间 如 下 : 
i, Sh tt (27-4) 
为 了 完成 分 析 ， 我 们 认为 ， 传 输 延 迟 只 是 从 输入 g sk d 到 输出 g 的 延迟 。 对 于 tang, 1i 
路 径 上 包括 了 门 U3 U4 和 U5。 对 于 co， 路 径 上 则 包括 U4 和 U5 (回忆 此 处 , 我 们 只 担心 过 
g 上升 的 情况 )。 因 此 ,我们 有 : 
tang = max(t,,t,) + t, (27-5) 
taco = ty +t (27-6) 
锁 存 器 的 另 一 种 门 级 实现 方式 如 图 27-4 所 示 。 这 里 ， 我 们 通过 给 RS 触发 器 增加 一 级 选 通 
电路 来 构造 锁 存 器 (14.1 49). RS 触发 器 由 与 非 门 U4 和 U5 组 成 ， 当 U4 上 面 的 输入 s 有 效 
( 低 ) HF, 触发 器 置 位 (g =1, ¢=0); 当 U5 下面 的 输入 r 有 效 ( 低 ) 时 ， 触 发 器 复位 (q =0, 
q=1). 
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Ul. U2 和 U3 组 成 门 电路 ， 当 g =1, d=1 时 触发 器 置 位 ， 当 g =1，d=0 时 触发 器 复位 。 
Aut, “Se 为 高 时 ， 输 出 9 随 着 输入 4d 变化; 当 g 为 g 
低 时 ， 触 发 器 既 不 置 位 ， 也 不 复位 ， 而 是 保持 之 前 的 
状态 不 变 。 

虽然 图 27-4 的 锁 存 器 与 图 27-3 BEAR BFE ñ HJ 
逻辑 行为 相同 ,但 时 序 特性 却 大 不 同 ,我 们 将 这 些 时 d 
序 特性 留 作 习题 27. 1 ~ 习题 27. 4。 


27.2 触发 器 的 内 部 结构 


一 个 边沿 触发 的 D 触发 器 在 时 钟 的 上 升 沿 用 输入 的 现 态 来 更 新 输出 ， 其 他 时 刻 输出 保持 现 
态 不 变 。D 触发 器 的 原理 图 符号 和 时 序 图 如 图 27-5 所 示 (与 图 15-5 重复 ) 。 在 14.2 节 ， 我 们 
看 到 了 如 何 将 D 触发 器 用 于 同步 时 序 电 路 的 状态 寄存 器 中 。 在 第 15 章 , 我 们 看 了 D 触发 器 的 
详细 时 序 特 性 。 在 本 节 ， 我 们 得 出 D 触发 需 的 逻辑 设计 ， 看 看 该 逻辑 设计 是 如 何 产生 触发 器 的 


时 序 特 性 的 。 
d q dE x VE 
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a) b) 
图 27-5 边沿 触发 D 触发 器 : a) 原理 图 符号 ; b) 展示 电路 行为 的 时 序 图 


带 反 相 使 能 端的 锁 存 器 是 我 们 要 构建 的 触发 器 的 一 半 ， 当 使 能 信号 上 升 时 ， 对 输入 进行 采 
样 ， 当 反 相 使 能 信号 为 高 时 ， 保 持 输出 稳定 不 变 。 问 题 是 ， 当 反 相 使 能 为 低 时 ， 输 出 随 着 输入 
变化 。 我 们 可 以 用 第 二 个 锁 存 器 与 第 一 个 串联 来 纠正 这 一 行为 缺陷 。 这 个 锁 存 器 带 有 正常 的 使 
能 端 ， 当 使 能 信号 为 低 时 ， 可 以 防止 输出 改变 。 

两 个 带 互 补 使 能 端的 锁 存 器 串联 构成 的 D 触发 器 如 图 27-6a 所 示 。 触 发 器 的 操作 说 明 如 
图 27-6b 的 波形 图 所 示 。 第 一 个 锁 存 器 称 为 主 锁 存 器 ， 它 在 时 钟 的 上 升 沿 采样 输入 ， 并 输出 到 
中 间 信 号 m。 在 波形 图 中 ， 当 时 钟 变 高 时 ，m 采样 b 值 并 保持 。 但 是 ， 当 时 钟 为 低 时 ,信号 m 
跟随 输入 变化 。 第 二 个 锁 存 器 称 为 从 锁 存 器 (因为 它 紧 跟着 主 锁 存 器 ) ， 当 时 钟 为 高 时 ， 将 信 
号 m 上 捕获 的 数据 输出 。 当 时 钟 下 降 时 ， 采样 该 值 ( 该 值 仍 被 主 锁 存 器 保持 不 变 ) ， 并 在 时 钟 
为 低 时 保持 输出 该 值 。 这 两 个 锁 存 器 最 终 组 成 的 设备 就 像 一 个 D fh ete, ETE BPAY EF 
样 数据 并 保持 稳定 ， 直 到 下 一 个 上 升 沿 出 现 。 当 时 钟 为 高 时 ， 主 锁 存 器 保持 采样 值 ， 而 从 锁 存 
器 是 透明 的 。 当 时 钟 为 低 时 ， 从 锁 存 器 保持 采样 值 ， 而 主 锁 存 器 是 透明 的 。 
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d ña q fe Rae Mn sap 

d L W C E C X B Ct. 

clk 


| EES A =b. ==. 
a) b) 
图 27-6 由 两 个 锁 存 器 构成 的 主 从 D 触发 器 


为 了 正确 操作 主 从 触发 器 ， 有 一 点 很 关键 : 从 锁 存 器 时 钟 下 降 1, 后 ， 主 锁 存 器 的 输出 才 改 





图 27-4 从 RS 触发 需 构 造 的 锁 存 器 


927% fh AR FE 405 





变 。 也 就 是 说 ， 必 须 满足 从 锁 存 器 的 保持 时 间 的 约束 。 如 果 时 钟 下 降 后 ， 主 锁 存 器 的 输出 变化 
太 快 ， 那 么 在 从 锁 存 器 锁定 输出 前 ， 中 间 信 号 m 上 出 现 的 新 值 ( 波 形 中 的 d 值 》 就 会 被 输出 。 
实际 中 ， 这 个 问题 很 少见 ， 除 非 主 从 锁 存 器 之 间 存 在 很 大 的 时 钟 相 位 差 (15.4 节 ) 。 

从 图 27-6a 的 原理 图 和 锁 存 器 的 时 序 特性 ， 我 们 可 以 得 出 触发 器 的 时 序 特性 。 触 发 器 的 建 
立 和 保持 时 间 就 是 主 锁 存 器 的 建立 和 保持 时 间 。 这 部 分 用 来 进行 采样 。 触 发 器 的 延迟 uc 就 是 
从 锁 存 器 的 延迟 tye 0° 时 钟 上 升 沿 ko 后 ， 输 出 4 变 为 新 值 。 

为 了 用 一 个 更 具体 的 方式 盖 明 D 触发 器 的 时 序 特性 ,我们 来 看 图 27-7 所 示 的 门 级 原理 图 。 
该 图 将 图 27-6 的 主 从 触发 器 扩展 到 了 门 级 进行 展示 。 每 个 锁 存 器 的 使 能 输入 端的 反 相 器 已 经 
被 分 离 出 了 一 个 反 相 器 U1， 该 反 相 器 产生 clk。 连 接 到 主 和 从 的 时 钟 的 极 性 是 相反 的 。 

如 图 27-7 所 示 ， 触 发 器 的 建立 时 间 4. 是 指 : 当 clk 为 低 电 平时 ，d 变化 后 ， 电 路 到 达 稳 定 
状态 所 需要 的 时 间 。 





图 27-7 EM D 触发 器 的 门 级 原理 图 


严格 来 讲 ， 此 处 的 信和 号 路 径 是 从 U4 到 U5 ， 再 到 U3 或 U7 (如 果 g 为 高 ) 但 是 , 我们 并 
不 真正 关心 U7 的 输出 是 否 达 到 了 稳 态 ， 因 为 时 钟 变 高 时 使 能 U8。 因 此 我 们 忽略 07， 而 把 注 
意 力 集中 在 以 U3 的 输出 作为 终点 的 那 条 路 径 上 ， 得 到 
t = S oF y th, =e, (27-7) 
此 处 ，: 是 主 锁 存 器 的 建立 时 间 。 
触发 器 的 保持 时 间 是 电路 的 主 部 分 在 时 钟 上 升 后 要 达到 稳定 的 时 间 ， 这 刚好 是 门 Ul 和 U2 的 
最 大 延迟 。 如 果 在 Ul 的 输出 clk 变 低 前 ， 数 据 发 生变 化 ， 那 么 状态 m 将 会 受到 影响 。 同 样 ， 在 U2 
的 输出 稳定 前 ， 数 据 也 不 能 变化 ， 和 否则 我 们 可 能 会 丢掉 存储 在 主 锁 存 器 中 的 值 。 因 此 ， 我 们 有 
t, = max(t, ,t;) (27-8) 
比较 式 (27-4) ， 这 里 并 没有 将 t, Ae, 相 加 ， 因 为 主 锁 存 器 虽然 是 低 有 效 使 能 ， 但 U1 并 不 在 
MA clk 到 U2 输出 这 一 条 路 径 上 。 
为 了 计算 保持 时 间 ， 我 们 仅 关心 主 锁 存 器 到 达 稳 态 。 当 时 钟 上 升 时 ， 从 锁 存 器 可 能 要 花 更 
长 的 时 间 才 能 到 达 稳 态 。 但 是 ， 只 要 主 锁 存 器 到 达 稳 态 ， 我 们 就 可 以 可 靠 地 捕获 数据 。 
最 后 ,tico 是 从 时 钟 上 升 到 触发 器 输出 的 延迟 。 这 条 路 径 经 过 了 U8 和 U9， 如 下 : 
laco = ts + ts = lico (27-9) 
其 中 ，ticw. 是 从 触发 器 的 tico。 
EA D 触发 器 的 另 一 种 门 级 原理 图 如 图 27-8 所 示 ， 该 电路 使 用 图 27-4 构成 锁 存 器 的 RS 
触发 器 组 成 触发 器 的 主 和 从 锁 存 器 。 我 们 将 该 触发 器 的 六、 点 和 taco 的 推导 留 到 习题 27-5 ~ >J 
题 27-7。 


O ”这 里 假设 建立 时 间 足 够 大 ， 即 时 钟 上 升 沿 到 来 前 ， 信 号 严 已 经 稳定 了 ts 。 其 他 情况 的 例子 见习 题 27. 11。 
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图 27-8 主 从 D 触发 器 的 另 一 种 门 级 原理 图 


27.3 CMOS 锁 存 器 与 触发 器 


图 27-3 和 图 27-4 中 的 锁 存 器 电路 都 使 用 了 静态 CMOS 门 。 但 是 ，CMOS 技术 也 允许 我 们 
使 用 传输 门 和 三 态 反 相 器 构建 锁 存 器 ， 如 图 27-9 所 示 。 大 部 分 CMOS 锁 存 器 这 样 使 用 传输 门 ， 
因为 这 样 构建 的 锁 存 器 比 其 他 的 门 电路 体积 更 小 ， 速 度 更 快 。 

当 使 能 信号 z 为 高 电 平 (ZAIE) BT, H NFET MI 
和 PFET M2 组 成 的 传输 门 打 开 ， 人 允许 输入 d 上 的 值 传 到 存储 
节点 s。 如 果 d=1，PFET M2 将 1 从 dd 传送 到 s; 如 果 d=0， 
NFET M1 将 0 从 4 传输 到 s。 输 出 g 跟随 存储 节点 变化， 经 
过 反 相 器 U2 和 U4 进行 缓冲 。 因 此 ， 当 g 为 高 电 平时 ， 输 出 
q 跟随 输入 了 变化 。 

当 使 能 信号 g 为 低 电 平时 ， 由 MI 和 M2 组 成 的 传输 门 关 图 27-9 使 用 传输 门 和 三 态 反 相 
闭 ， 输 入 与 存储 节点 * 断 开 。 此 时 ， 输 入 被 采样 到 存储 节点 。 kika isi 
同时 ， 三 态 反 相 器 U3 打开 ， 从 * 经 过 两 个 反 相 器 返回 * 的 存储 环 闭合 。 这 个 反馈 回路 强化 了 所 
存储 的 值 ， 使 它 可 以 一 直 保持 下 去 。 三 态 反 相 器 相当 于 一 个 反 相 器 后 跟 一 个 传输 门 。 

我 们 可 以 用 与 门 级 锁 存 器 同样 的 方式 来 计算 CMOS 锁 存 器 的 建立 、 保 持 和 延迟 时 间 。 当 g 
为 高 时 ， 输 入 变化 ， 对 存储 回路 产生 影响 ， 在 允许 5 下 降 之 前 ， 存 储 回路 必须 稳定 。 输 入 的 变 
化 必须 通过 传输 门 和 反 相 器 U2 进行 传送 。 我 们 不 需要 等 到 U4 驱动 输出 g， 因 为 这 不 会 影响 存 
储 回路 。 因 此 ， 建 立时 间 如 下 ， 





t = t +t, (27-10) 
其 中 , eteta AY HEI 
8 变 低 后 ,我 们 需要 保持 输入 d 的 值 不 变 ， 直 到 传输 门 完 全 关闭 。 这 正好 是 反 相 器 U1 的 
延迟 : . 
i, = 6 (27-11) 
我 们 不 需要 等 到 反馈 门 U3 打开 ， 它 的 输出 (存储 节点 s) 已 经 处 于 正确 的 状态 ,在 U3 打开 
前 ， 节 点 * 有 足够 的 能 力 保持 它 的 值 稳定 。 
通过 追踪 从 输入 到 输出 的 路 径 ， 计 算得 到 的 延迟 时 间 为 : 
bcg = b + t, + t, + t, (27-12) 
tang = t, +t, + t, (27-13) 
两 个 CMOS 锁 存 器 可 以 构成 一 个 CMOS 触发 器 ， 如 图 27-10 所 示 。 主 锁 存 器 由 NFET M1, 
PFET M2、 反 相 器 U2 MSAK U3 组 成 。 当 使 能 z 为 低 时 ， 输 入 4d 连接 到 存储 节点 m， 当 
g 为 高 时 ，m 保持 。 从 锁 存 器 由 NFET M3, PFET M4、 反 相 器 U4 和 三 态 反 相 器 U5 组 成 。 当 使 
能 z 为 高 时 ， 主 锁 存 器 状态 m 连接 到 存储 节点 s， 用 一 个 额外 的 反 相 器 U6 产生 输出 q. 
输出 q 在 逻辑 上 与 U4 输出 的 节点 s 相同 , 但 是 ， 采用 这 种 方式 将 存储 回路 与 输出 隔离 开 
来 对 触发 器 的 同步 特性 而 言 很 关键 ， 这 一 点 将 在 第 29 章 讨论 。 我 们 将 这 种 触发 器 的 分 析 留 到 
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习题 27. 8 ~ 习题 27. 10, 





图 27-10 由 两 个 CMOS 锁 存 器 构成 的 CMOS 触发 器 电路 


27.4 ， 锁 存 器 的 流 表 推理 


锁 存 器 和 触发 器 都 是 异步 电路 ， 可 以 使 用 第 26 章 研 制 的 流 表 技术 进行 综合 。 从 给 出 的 锁 
存 器 的 英文 描述 可 以 写 出 该 锁 存 器 的 流 表 ， 如 图 27-11 所 示 。 我 们 从 所 有 输入 和 输出 均 为 低 的 
状态 CARAS A) 开始 ， 依 次 改变 每 个 输入 来 列举 状态 。 在 每 一 个 新 状态 重复 这 个 过 程 ， 直 到 探 
索 到 所 有 可 能 的 状态 为 止 。 


次 态 (g,d) ”输出 
现 态 00 01 11 10 (4) 
A (A) F B 0 
B A c 0 
C DOB 1 现 态 次 态 (g,d) ”输出 
D —E@c 1 “00 01 11 10 (Q) 
Bil). 00 Bert A @@ c @ o 
E oe me 0 c OOO: 1 
b) c) 


AA 27-11 锁 存 器 的 流 表 综 合 : a) 波形 图 ; b) 流 表 ; e) 化 简 的 流 表 


在 状态 A, g 变 高 ， 进 入 状态 B, d 变 高 ， 进 入 状态 Ff， 由 此 得 到 图 27-11b 的 流 表 的 第 一 
行 。 在 状态 B，g 变 低 ， 返 回 到 状态 A, d 变 高 ， 进 入 状态 C, 并且 q 变 高 ， 由 此 得 到 流 表 的 第 
二 行 。 我 们 按照 这 种 方式 逐 行 构建 流 表 ， 直 到 枚 举 所 有 的 状态 。 最 终结 果 如 图 27-11b 所 示 。 [555] 

在 构建 流 表 时 ， 我们 为 每 一 个 明显 不 同 于 已 有 状态 的 输入 组 合 创建 了 一 个 新 的 状态 ， 共 得 
到 了 6 个 状态 ，A ~F。6 个 状态 要 用 3 个 状态 变量 来 表示 。 但 是 ， 其 中 有 很 多 状态 是 等 价 的 ， 
可 以 进行 合并 。 如 果 两 个 状态 从 电路 的 输入 和 输出 上 无 法 进行 区 分 ， 则 认为 两 者 是 等 价 的 。 

我 们 递归 地 定义 等 价 。 如 果 对 于 所 有 的 输入 组 合 ， 输 出 都 相同 ， 就 说 这 两 个 状态 0 - 等 
价 。 这 里 ， 状 态 A、B 和 了 是 0- 等 价 状态 ， 状 态 C、D ALE th 0 -等 价 状态 。 如 果 对 于 所 有 
的 输入 组 合 ， 输 出 都 相同 ， 并 且 对 于 每 个 输入 组 合 ， 它 们 的 次 态 为 下 ， 就 说 这 两 个 状态 上 -等 
价 ， 即 1- 等 价 。 这 里 ,我 们 看 到 ，A、B 和 下 的 次 态 不 只 等 价 ， 它们 是 相同 的 ， 因此, A、B 
MFE- Ehr E, C, DAE EEL -Eft 
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实际 中 ， 查 找 等 价 状态 的 过 程 为 : 构成 0 - 等 价 状态 集 (如 |A, B. FI 和 iC, D, E|), 
然后 构成 1 - 等 价 状态 集 ， 以 此 类 推 ， 直 到 集合 不 变 。 当 我 们 找到 一 个 状态 集合 ， 该 集合 既是 
上 -等 价 ， 也 是 上 +1=- 等 价 ,我 们 就 说 这 些 集合 是 等 价 的 。 

在 这 种 情况 下 ,状态 A、B 和 下 是 等 价 的 ,状态 C、D 和 下 是 等 价 的 。 用 状态 A 和 C (每 
个 等 价 类 一 个 ) 改写 流 表 ， 可 以 得 到 如 图 27-1le 所 示 的 化 简 后 的 流 表 。 

如 果 我 们 使 用 输出 作为 状态 变量 ， 给 状态 A 分 配 编 码 0， 状 态 C 分 配 编码 1， 可 以 将 
图 27-11c 的 化 简 后 的 流 表 改写 为 图 27-12a 所 示 的 卡 诺 图 。 该 卡 诺 图 上 标 有 三 个 蕴涵 项 。 虽然 
只 用 两 个 蕴涵 项 (ggd = X11 V 10X) 即 可 涵盖 其 功能 ， 但 仍 需要 用 第 三 项 1X1 来 避免 险象 ( 见 
第 6. 10 节 ) 。 当 使 能 输入 g 下 降 时 (ggd 从 111 变 为 101) ， 如 果 输 出 瞬间 变 为 低 ， 终 态 会 变 为 
001， 锁 存 器 丢掉 了 已 存储 的 1。 增 加 的 蕴涵 项 (1X1) 避免 了 该 险象 的 发 生 。 锁 存 器 电路 的 原 
理 图 如 图 27-12b 所 示 。 





图 27-12 锁 存 器 的 逻辑 设计 : a) 卡 诺 图 ; b) MR, ARRAT 1X1 用 于 避免 险象 


27.5 D 触发 器 的 流 表 综 合 

图 27-13 JER T D 触发 器 流 表 的 推导 过 程 。 我 们 先 来 看 流 表 中 列 出 的 所 有 8 个 状态 的 波 
形 图 。 与 锁 存 器 相似 ， 我 们 通过 每 个 状态 下 的 各 输入 (clk Ald) 来 构建 流 表 。 我 们 将 每 个 
明显 与 已 经 列 出 的 状态 不 等 价 的 输入 组 合 看 作 一 个 新 的 状态 ， 最 终生 成 的 流 表 有 8 个 状态 ， 
如 图 27-13b 所 示 。 

下 一 步 是 找 出 状态 等 价 类 。 首 先 ， 我 们 观察 得 到 0 - 等 价 集 是 1A, B,C, D| 和 {E, F, 
G, Hl 。 对 于 1 -等 价 ,我 们 观察 到 ， 状 态 D 在 输入 为 11 时 的 次 态 与 集合 中 其 余 状 态 的 次 态 位 
于 不 同 的 类 里 。 状 态 H 在 输入 为 10 时 的 情况 与 上 面 的 相似 。 因 此 ，1 - 等 价 集 变 为 |}A，B， 
C|, £D)], EE, F, Gl 和 LHP, l 

化 简 后 仅 有 4 个 状态 的 流 表 如 图 27-13c 所 示 。 输 出 q 为 状态 变量 之 一 ， 分 配 的 第 二 个 状态 
变量 如 表 中 的 “编码 ” 列 所 示 。 这 里 ,9 是 两 位 状态 编码 的 高 位 ， 新 变量 是 低位 。 

图 27-14 展示 了 图 27-13e 的 流 表 是 如 何 化 简 为 逻辑 电路 的 。 我 们 从 将 流 表 重 画 为 带 
符号 标注 的 卡 诺 图 开始 ， 如 图 27-14a 所 示 。 变 量 g 为 输出 ， 变 量 x 是 增加 的 状态 变量 。 
下 一 步 是 用 状态 编码 qx 替换 符号 表示 的 次 态 ， 如 图 27-14b 所 示 。 接 着 写 出 两 个 状态 变量 
的 卡 诺 图 ， 如 图 27-14c 所 示 ( 原 书 有 误 一 一 译 者 注 ) ， 其 中 ，g 的 卡 诺 图 在 左边 ，x 的 卡 诺 图 
在 右边 。 

两 个 次 态 变 量 函 数 都 可 以 用 两 个 蕴涵 项 表示 。 像 锁 存 器 一 样 ， 我 们 必须 增加 第 三 项 以 避免 
险象 。 对 于 变量 4， 包括 蕴涵 项 gred = X11X、1X0X 和 用 于 消除 险象 的 11XX。 对 于 x， 包 括 蕴 
涵 项 X11X、XX01 和 用 于 消除 险象 的 和 L 乱 。 从 这 些 蕴涵 项 画 出 的 逻辑 电路 如 图 27-14d 所 示 。 
可 以 看 到 ， 我 们 使 用 图 27-7 的 厄 尔 锁 存 器 综合 出 了 主 从 D 触发 器 。 细 心 的 读者 会 注意 到 ， 主 
锁 存 器 最 上 面 的 与 门 与 从 锁 存 器 最 下 面 的 与 门 的 输入 相同 ， 所 以 可 以 用 一 个 共享 的 与 门 来 替换 
泥人 Js 
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Al 27-14 从 图 27-13e 的 流 表 得 出 D 触发 器 的 逻辑 设计 : a) 绘制 在 卡 诺 图 上 的 流 表 ; 
b) 显示 了 次 态 函 数 的 卡 诺 图 ; c) 次 态 函 数 各 位 的 卡 诺 图 ; d) 从 卡 诺 图 得 
出 的 逻辑 电路 图 
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小 结 


本 章 我 们 讨论 了 触发 器 的 内 部 结构 ， 有 助 于 更 好 地 理解 触发 器 的 行为 和 时 序 约束 。 我 们 首 
先 得 出 了 一 个 锁 存 器 电路 一 一 尼 尔 锁 存 器 ， 然 后 ， 使 用 这 个 电路 ， 依 据 其 内 部 的 门 延迟 ， 得 出 
了 锁 存 器 的 建立 、 保 持 和 延迟 时 间 。 

将 两 个 锁 存 器 组 合 起 来 形成 一 个 主 从 触发 器 。 主 锁 存 器 在 时 钟 为 低 时 使 能 ， 在 时 钟 为 低 
时 ， 输 出 随 着 输入 变化 ,在 时 钟 的 上 升 洛 ， 输 出 采样 输入 。 从 锁 存 器 在 时 钟 为 高 时 使 能 ， 当 时 
钟 为 低 时 ， 输 出 保持 不 变 。 分 析 这 个 电路 可 以 得 到 触发 器 的 建立 、 保 持 和 延迟 时 间 。 

在 CMOS 逻辑 中 ， 锁 存 器 和 触发 器 通常 用 传输 门 来 实现 ， 但 是 它们 的 行为 和 分 析 与 用 厄 尔 
锁 存 器 实现 的 相同 。 

最 后 ， 我 们 完成 了 锁 存 顺和 触发 器 的 流 表 分 析 。 该 分 析 对 触发 器 的 行为 给 出 了 更 深刻 的 理 
解 ， 也 为 流 表 分 析 提 供 了 一 个 好 例子 。 


文献 说 明 


厄 尔 锁 存 器 是 IBM 在 20 世纪 60 年 代 中 期 研制 出 的 ， 在 1965 年 公开 [37] ， 并 在 1967 年 
获得 了 一 项 专利 [38] 。 和 触发 器 的 更 详细 讨论 可 以 查阅 电路 教材 [108] ， 也 可 以 参考 [27] 和 
[64] 的 对 比 研 究 论文 。 


习题 

27.1 锁 存 器 时 序 特性 ，I。 根 据 各 门 的 延迟 计算 图 27-4 的 锁 存 器 的 1。 假设 门 Ui 的 延迟 为 1;。 

27.2 锁 存 器 时 序 特性 ，I。 根 据 各 门 的 延迟 计算 图 27-4 的 锁 存 器 的 tpo BEE] Ui 的 延迟 为 ti;。 

27.3 锁 存 器 时 序 特性 ，II。 根 据 各 门 的 延迟 计算 图 27-4 的 锁 存 器 的 tago BT Ui 的 延迟 为 i,。 

27.4 锁 存 器 时 序 特 性 ，IV。 根 据 各 门 的 延迟 计算 图 27-4 的 锁 存 器 的 taco。 假设 门 Ui 的 延迟 为 1;。 

27.5 和 触发 器 时 序 特性 ，I。 根 据 各 门 的 延迟 计算 图 27-8 的 D 触发 器 的 1,。 假 设 门 Ui 的 延迟 为 i;。 

27.6 和 触发 器 时 序 特性 ，I。 根 据 各 门 的 延迟 计算 图 27-8 BJ D 触发 器 的 如。 假设 门 Ui 的 延迟 为 4;。 

27.7 和 触发 器 时 序 特性 ， 荆 。 根 据 各 门 的 延迟 计算 图 27-8 的 DD 触发 器 的 taco。 假设 门 Ui 的 延迟 为 1;。 

27.8 CMOS 触发 器 时 序 特性 ，I。 根据 各 门 〈 和 传输 门 ) 的 延迟 计算 图 27-10 的 D 触发 器 的 1,。 假 设 门 
Ui 的 延迟 为 t;， 每 个 传输 门 的 延迟 为 i 。 

27.9 CMOS 触发 器 时 序 特 性 ，I。 根 据 各 门 (和 传输 门 ) 的 延迟 计算 图 27-10 的 DD 触发 器 的 证 。 假 设 门 
Ui 的 延迟 为 ti, EMER TERN tyo 

27.10 CMOS 触发 器 时 序 特性 ，II。 根 据 各 门 〈 和 传输 门 ) 的 延迟 计算 图 27-10 的 D 触发 器 的 tico。 假 
设 门 Ui 的 延迟 为 i;， 每 个 传输 门 的 延迟 为 1,。 

27.11 触发 器 的 污染 延迟 ，[。 考 虑 一 个 触发 占 是 通过 在 主 从 锁 存 器 之 间 放 置 一 条 延迟 时 间 为 i 的 延迟 
线 构成 。 在 时 钟 上 升 前 ， 触 发 器 的 输入 d 正好 变化 了 t;， 在 时 钟 边沿 ， 延 迟 线 的 输入 信号 m 正好 
变 为 有 效 ， 在 时 钟 的 上 升 沿 之 后 ， 延 迟 线 的 输出 信号 ml 和 到 从 锁 存 器 的 输入 有 效 了 ty. KE 
改 后 的 触发 器 的 污染 延迟 i.co 和 传播 延迟 taco 分 别 是 多 少 ? 

27.12 PR BAF HIER, I, JE 27.11 触发 器 的 的 最 大 的 合法 值 是 多 少 ? 

27.13 脉冲 锁 存 触发 器 ，I。 另 一 种 D 触发 器 设计 如 图 27-15 所 示 。 该 触发 器 是 由 一 个 由 脉冲 发 生 器 选 


通 的 锁 存 器 组 成 。 当 clk 上 升 时 ， 在 使 能 信号 g 上 产生 一 个 窜 脉 串 ， 从 而 对 d 进行 采样 。 然 后 锁 存 
器 保持 该 采样 值 ， 直 到 时 钟 出 现下 一 个 上 升 沿 。 看 图 27-15e 的 电路 ， 回 答 下 面 的 问题 。 假 设 门 
Ui 的 延迟 为 tio 
(a) 可 以 使 该 电路 正常 工作 的 U2 产生 的 最 小 脉 宽 是 多 少 ? 
(b) 可 以 使 该 电路 正常 工作 的 U2 产生 的 最 大 脉 宽 ( 如果 有 的 话 ) 是 多 少 ? 

27.14 OPARA, IM 假设 U2 输出 的 脉 宽 是 你 在 习题 27. 13 (a) 中 计算 的 值 ， 那么 计算 这 个 脉 
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27.15 
27.16 


27.17 


27.18 


27.19 





冲 锁 存 触发 需 的 去 、 和 taco， 并 把 这 些 值 与 正文 中 所 分 析 的 主 从 触发 器 的 时 序 参数 进行 比较 。 
特别 来 比较 一 下 两 个 触发 器 的 总 开销 1, + tice。 

CMOS 脉冲 锁 存 触 发 器 ，1。 针 对 图 27-15b 的 CMOS 脉冲 锁 存 器 ， 重 做 习题 27. 13。 

CMOS 脉冲 锁 存 触发 器 ，II。 针 对 图 27-15b 的 CMOS 脉冲 锁 存 器 ， 重 做 习题 27. 14。 





图 27-15 脉冲 锁 存 D 触发 器 : a) 使 用 锁 存 器 符号 的 原理 图 ; b) 内 部 使 用 CMOS 锁 存 
需 的 原理 图 ; e) 内 部 使 用 龙 尔 锁 存 器 的 原理 图 。 当 clk 上 升 时 ,与 非 门 U2 


在 g& 上 产生 一 个 低 通 窜 脉 冲 ， 从 而 使 能 锁 存 器 对 a 进行 采样 


7474 触发 器 ，1。 图 27-16 展示 了 另 一 种 类 型 的 DD 触发 器 一 一 7474 触发 器 的 原理 图 。 与 其 他 D fh 
发 器 一 样 ， 它 有 一 个 时 钟 输入 (c) 和 一 个 数据 输入 (d)。 电 路 本 身 可 以 拆 分 为 一 个 RS 锁 存 器 
(最 右 侧 的 两 个 与 非 门 ) 和 一 个 四 态 异 步 电 路 (最 左 侧 

的 四 个 与 非 门 )。 夯 出 这 个 四 态 异 步 电 路 的 流 表 ， 圈 出 
其 中 的 稳 态 。 解 释 这 个 电路 是 如 何 运行 的 。 包 括 状 态 转 
换 ， 展 示 了 输出 只 能 在 时 钟 的 上 升 沿 改变 。 

7474 触发 器 ，IJ。 图 27-16 的 7474 D 触发 器 的 建立 和 保 

持 时 间 是 多 少 ? 假设 每 个 与 非 门 的 延迟 是 常数 1。 

组 合 逻 辑 与 存储 。 本 问题 探讨 锁 存 器 的 构建 ， 该 锁 存 右 

有 两 个 输入 (a Alb), 并 存储 两 个 输入 值 的 与 运算 
结果 。 

(a) 使 用 图 27-3 的 厄 尔 锁 存 器 ， 在 输入 之 前 放置 一 个 

二 输入 与 门 ， 推 导 该 系统 的 时 序 。 假 设 门 Ui 的 延 4 
BA he 图 27-16 习题 27.17 和 习题 27. 18 用 
修改 厄 尔 锁 存 器 ,给 U3 和 U4 各 增加 一 个 输入 ,使 到 的 7474 触发 器 设计 。 它 


a eee 给 一 个 带 反 相 输 入 端的 RS 
(e) Hib Mia, a 的 建立 和 保持 时 间 是 多 少 ? 锁 存 器 组 成 


(b 


— 
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当 我 们 违反 触发 器 的 建立 和 保持 时 间 约 束 时 将 会 发 生 什么 ? 到 目前 为 止 ， 我 们 只 考虑 了 满 
足 这 些 约 柬 条 件 时 触发 器 的 正常 行为 。 本 章 我 们 研究 当 违 反 这 些 约 束 条 件 时 触发 器 的 异常 行 
为 。 我 们 会 看 到 ， 违 反 建 立 和 保持 时 间 将 会 导致 触发 器 进入 亚 稳 态 ， 在 这 种 状态 下 ， 状 态 变量 
既 不 是 1， 也 不 是 0。 在 到 达 两 个 稳 态 (0 或 1) 其 中 之 一 之 前 ， 触 发 器 可 能 会 无 限期 地 保持 在 
亚 稳 态 。 在 数字 系统 中 ， 这 种 同步 失效 会 导致 严重 的 问题 。 

类 比 而 言 ， 触 发 器 很 像 人 。 如 果 你 善待 它们 ， 它 们 就 会 表现 良好 ; 如 果 你 虐待 它们 ， 它 们 
就 会 行为 不 佳 。 对 于 和 触发 需 ， 善 待 它们 就 是 遵守 它们 的 建立 和 保持 约束 条 件 。 只 要 善待 它们 ， 
触发 器 就 会 正常 运转 ， 绝 不 丢失 一 位 。 但 是 ， 如 果 你 违反 建立 和 保持 时 间 约 束 ， 虐 待 触发 器 ， 
它们 就 可 能 行为 失当 ,无 限期 地 停留 在 亚 稳 态 。 本 章 研 究 当 这 些 正 常 的 触发 器 变 坏 时 会 发 生 
什么 。 


28.1 同步 失效 

当 我 们 违反 D 触发 器 的 建立 和 保持 时 间 约 束 时 ， 和 触发 器 的 内 部 状态 会 进入 一 个 非法 状态 ， 
即 触 发 器 的 内 部 节点 电压 既 不 是 0 也 不 是 1。 如 果 触 发 器 的 输出 在 这 种 状态 下 采样 ， 结 果 将 是 
不 确定 的 ， 还 可 能 前 后 矛盾 。 一 些 门 可 能 将 触发 人 器 的 输出 看 作 0， 而 另 一 些 则 可 能 将 它 看 作 1， 
还 有 一 些 可 能 会 传送 这 种 不 确定 状态 。 

考虑 下 面 D 触发 器 的 实验 : 起 初 ，d 和 clk 均 为 低 电 平 ,在 实验 过 程 中 ,它们 都 变 高 。 
如 果 信 号 d 在 clk 之 前 t. 变 高 ,实验 结束 时 输出 g 将 为 1。 如 果 信 号 clk 在 d 之 前 4 变 高 ， 实 
验 结束 时 输出 q 将 为 0。 现 在 来 考虑 ， 当 d 的 升 高 时 间 相 对 于 clk 在 clk 之 前 i, 到 时 钟 之 后 t, 
之 间 逐 渐变 化 时 ， 会 发 生 什么 。 在 某 些 情 况 下 ， 在 这 个 区 间 内 ， 在 实验 结束 时 输出 4 会 从 1 
变 为 0。 

要 看 看 当 输 入 在 这 个 禁止 区 间 内 变化 时 会 发 生 什么 ， 来 考虑 图 28-1a 所 示 的 CMOS D 触发 
器 的 主 锁 存 器 。 这 里 ， 我 们 假设 电源 电压 是 1 V， 所 以 逻辑 1 是 1V, 223480 E0 V. 图 28-1b 
展示 了 触发 器 初始 状态 的 电压 (时 钟 上 升 后 的 瞬间 ， 反 相 器 两 端的 电压 AV=V - V,) , EAE RC 
据 转换 时 间 的 函数 。 如 果 4 在 clk 之 前 至 少 t 升 高 ， 在 时 钟 下 降 前 ， 标 为 VY 的 节点 完全 充电 到 
LV, RA V 的 节点 完全 放电 到 0 V。 因 此 ， 状 态 电 压 AV=V 一 为 1V。 之 后 ， 当 4d 变化 时 ， 
状态 电压 的 减 小 如 图 28-1b FR. EW, V 仍 完全 充电 ， 但 是 V, 并 没有 时 间 去 完全 放电 。 再 
后 来 ， 当 d 升 高 时 ，V, 没有 时 间 去 完全 充电 。 最 终 ， 当 d 在 时 钟 之 后 ú 升 高 时 ,，V, 根本 没有 
时 间 充 电 , FATA V. =0 M V, =1, Auk AV= -1, 

初始 状态 电压 AV 是 数据 转换 时 间 的 连续 函数 ， 因 为 它 从 -i 扫描 到 了 1,。 它 可 能 不 是 一 
个 如 图 中 所 示 的 准确 的 线性 函数 ， 但 它 是 连续 的 ， 并 且 在 这 个 区 间 里 的 某 一 点 过 零点 。 在 整个 
区 间 里 ， 触 发 器 的 初始 状态 电压 既 不 是 +1 也 不 是 -1。 它 的 输出 并 不 是 一 个 完全 标准 的 数字 
信号 ， 有 可 能 被 后 面 的 逻辑 电路 所 曲解 。 


O 技术 上 讲 ， 任 何 大 于 Vu |F Vi 的 输出 电压 都 不 会 被 曲解 。 但 是 ， 在 本 章 剩余 部 分 ， 我 们 认为 -1 到 +1 之 间 
的 起 始 状态 电压 是 不 合法 的 。 
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AV. 


clk 






数据 转换 时 间 


a) b) 
图 28-1 触发 器 主 锁 存 器 的 异常 操作 。a) 锁 存 器 原理 图 。b) 状态 电压 与 数据 转换 时 间 
(data transition time) 。 当 数据 转换 时 间 从 时 钟 前 t 扫描 到 时 钟 后 6, 时， 状态 电 压 
(例如 ， 存储 反 相 器 两 端的 电压 AV =V- V,) 从 +1 变 到 -1 


28.2 WA 


同步 失效 好 的 一 点 是 ， 违 反 时 序 约束 后 触发 器 所 能 停留 的 大 部 分 非法 状态 都 能 快速 退回 到 
合法 的 状态 0 或 1。 遗憾 的 是 ， 停 留 在 非法 亚 稳 态 的 电路 要 退回 到 合法 状态 需要 任意 长 的 时 间 。 

时 钟 升 高 后 ， 图 28-1a 的 锁 存 器 变 成 了 正 反馈 回路 〈 图 28-2a) 。 锁 存 器 的 输入 传输 门 关 
闭 ， 反 馈 三 态 反 相 器 被 使 能 ， 结 果 ， 等 效 电 路 成 了 两 个 背靠背 的 反 相 峰 。 

背靠背 反 相 器 的 DC 传递 曲线 如 图 28-2b 所 示 。 该 图 展示 了 传送 反 相 器 的 传递 曲线 ，V, 是 
V, 的 函数 (V, =f(V,)， 实 线 )， 也 展示 了 反馈 三 态 反 相 器 的 传递 曲线 ,，V, 是 V, 的 函数 
(V =f (WV)， 虚 线 )。 在 图 上 ， 两 条 线 相交 于 三 个 点 。 这 些 点 是 稳定 的 ， 在 某 种 意义 上 ， 它 们 
没有 扰动 ， 即 电压 V, 和 V, 不 会 变化 。 因 为 V AV) =f(/(V,)), 电路 可 以 不 确定 地 停留 在 
这 三 点 中 的 任意 一 个 。 





图 28-2 a) 时 钟 高 有 效 触发 器 的 输入 锁 存 器 相当 于 两 个 背靠背 的 反 相 器 。b) 背靠背 
反 相 器 的 DC 传递 特性 。 实 线 是 V, =f( V1 )， 虚 线 是 Vi SAV) BARAM 
个 稳定 点 和 一 个 亚 稳 态 点 


处 于 这 三 个 稳定 点 以 外 的 任 一 点 ， 电 路 都 会 快速 收敛 到 两 端的 两 个 稳定 点 之 一 。 例 如 ， 
假设 V, 略 低 于 中 心 点 ， 如 图 28-3 所 示 ， 这 会 使 得 V, 变 为 从 该 点 水 平移 动 到 虚线 所 到 达 的 
点 ， 而 这 又 反 过 来 驱动 V, 变 为 垂直 移动 到 实 线 所 到 达 的 点 ， 如 此 循环 ,电路 快速 收敛 到 
Kalo E. =O, 

DC 传递 曲线 的 这 种 迭代 过 于 简单 化 ,但 它 抓 住 了 要 点 。 在 三 个 稳定 点 中 的 任 一 个 ， 电 路 
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都 是 稳定 的 。 但 是 ， 如 果 两 个 端点 中 的 任 一 个 出 现 轻微 扰动 ， 状 态 会 回 到 该 端点 。 如 果 中 间 点 
出 现 轻微 扰动 ， 状 态 会 快速 收敛 到 最 近 的 端点 。 像 中 间 的 稳 态 一 样 ， 一 个 微小 的 扰动 便 可 使 系 
统 脱离 现 有 的 状态 ， 则 称 该 状态 是 亚 稳 态 的 。 

亚 稳 态 有 许多 实例 。 来 看 图 28-4 所 示 的 位 于 弯曲 的 山顶 上 的 一 个 球 ， 该 球 处 于 稳 态 。 即 
如 果 该 球 恰好 位 于 中 心 ， 因 为 没有 向 左 或 向 右 的 外 力作 用 ， 它 将 会 保持 在 该 稳 态 。 但 是 ， 如 果 
向 左 或 向 右 轻 推 小 球 ( 一 个 扰动 )， 它 将 会 离开 这 个 状态 ， 最终 到 达 山 底部 的 两 个 稳 态 其 中 之 
一 。 在 这 些 状 态 ， 轻 微 的 推动 会 使 小 球 返回 到 原来 的 状态 。 





图 28-3 通过 反复 应 用 两 个 反 相 器 的 图 28-4 位 于 山顶 的 球 处 于 亚 稳 态 。 没 有 外 
DC 传递 特性 来 粗略 估计 背 力 向 左 或 向 右 推 球 ， 它 静止 不 动 。 
靠背 反 相 器 的 动态 变化 ， 如 但 是 ， 向 左 或 向 右 的 一 个 轻微 扰动 
图 中 的 灰 线 所 示 将 会 使 球 脱离 静止 状态 ， 下 落 到 达 


左 侧 或 右 侧 山 底 部 的 稳 态 


山上 的 球 可 以 准确 地 类 比 触发 器 。 处 于 亚 稳 态 的 触发 器 (图 28-2 的 中 间 点 ) 就 好 比 位 于 
山顶 的 球 。 只 需 轻 轻 一 推 (或 者 一 开始 没有 处 于 正中 心 ) ， 电 路 就 会 滚 下 坡 到 达 两 个 稳 态 其 中 
之 一 。 

实际 上 ， 背 靠背 反 相 器 电路 的 动态 表现 受 控 于 以 下 的 微分 方程 : 

dAV AV 

ee (28-1) 
其 中 ,7, 是 背靠背 反 相 器 的 时 间 常 量 。 简 言 之 ， 触 发 器 的 变化 速率 AV 与 它 的 幅度 成 正比 。 它 
离 零点 越 远 ， 速 率 越 快 ， 直 到 达到 电源 电压 的 限制 。 

这 个 微分 方程 的 解 如 下 : A 
AV(t) = AV(0)exp(—) (28-2) 

当 AV 的 初 值 不 同时 ， 解 描绘 出 的 曲线 
如 图 28-5 所 示 。 随 着 背靠背 反 相 器 的 
指数 放大 ，AV 的 幅度 每 7, 增加 e 倍 。 
因此 ， 如 果 开 始 时 AV(0) =e ', Zit 
T. 时 间 ， 电 路 收敛 到 AV(t) =1。 相 似 
地 ， 如 果 开 始 时 AY(0) =e *, HRA 
过 2 + 时 间 达 到 收敛 ， 以 此 类 推 。 概 括 ` 
起 来 ， 电 路 收敛 到 AV= +1 或 -1 所 需 28-5 AV (0) 不 同 值 下 描绘 的 AV(1)。 每 个 时 间 常 
的 时 间 为 : 数 ，AV 的 幅度 增加 e 














t. =- T, log( AV(0) ) 


例 28-1 收敛 时 间 
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3 AV(O) =0.25 BF, 收敛 到 AV=1 需要 多 少时 间 ? 将 值 代 入 方程 (28-3) ， 得 到 上 : 
t. =—7,log(0.25) = 1.47, 


Gi) 28-2 最 小 初始 电压 


要 在 107, AK SIS AV(0) 的 最 小 值 是 多 少 ? 
为 了 解决 这 个 问题 ， 我 们 重新 整理 方程 (28-2) ， 解 出 AV(O): 


|AV(0)|< AV(+)exp(—) 


| AV(0) | < exp(- 10) 
|AV(0) | < 45 pV 


28.3 进入 和 脱离 非法 状态 的 概率 


如 果 用 一 个 时 钟 采样 异步 信号 〈 该 信号 可 以 在 任意 时 刻 改变 ) ， 那 么 触发 器 进入 亚 稳 态 的 
概率 是 多 少 ? 假设 时 钟 周期 是 i,， 触 发 器 的 建立 时 间 是 1.， 保 持 时 间 是 ts,。 异 步 信号 的 每 一 次 


改变 等 可 能 地 发 生 在 时 钟 周期 的 任 一 点 。 因 此 ， 就 有 概率 为 


t, + ty 
P, = — 


fet. + ty) 


by 


的 转换 违反 触发 器 的 建立 和 保持 时 间 ， 从 而 使 其 进入 非法 状态 。 


RAE AS Ws “的 频率 变化 ,那么 在 
整个 周期 的 禁止 建立 和 保持 期 间 ， 异 步 边 沿 的 
P: 下 降 。 因 此 ， 失 误 的 频率 (违反 建立 和 保持 
时 间 ) 为 

fe =f. Pr =f, fy (t, + ty) (28-5) 
例如 ,假设 有 一 个 触发 器 ，t, =t, = 100 ps, 
时 钟 周期 是 i, =2 ns, 那么 失误 的 概率 为 
P, = tb = SUP -0.1 (28-6) 
现在 来 考虑 ， 当 异步 信和 号 的 变化 频率 为 1 MHz, 
那么 失误 的 频率 为 


fe = f. P, = 1 MHz(0. 1) = 100 kHz 


Clk J \ | | 
a 


i 
wile. | 


图 28-6 用 一 个 时 钟 对 异步 信号 进行 采样 。 如 果 
在 时 钟 边沿 附近 的 + 间隔 时 间 内 异 
步 信号 发 生变 化 ， 那 么 触发 器 可 能 会 进 
人 非法 状态 


实际 中 ,我们 认为 采样 异步 信号 会 导致 不 可 接受 的 高 失误 率 的 发 生 。 


正如 我 们 将 在 第 29 章 看 到 的 ， 对 于 频繁 进入 非法 状态 这 一 问题 的 一 种 片面 的 解决 办 法 是 
将 该 状况 隐藏 一 段 时 间 t,， 以 允许 该 非法 状态 退回 到 两 个 稳 态 中 的 一 个 。 通 过 考虑 某 些 初始 状 
态 的 概率 和 退回 所 要 求 的 时 间 ， 我们 可 以 计算 出 触发 器 在 等 待 了 i, 后 仍然 处 于 非法 状态 的 


假定 触发 器 进入 了 非法 状态 ， 它 以 一 定 的 概率 到 达 特 殊 的 状态 电压 AV RTA GER 
地 ) 估计 这 一 概率 均匀 分 布 在 区 间 ( -1, 1)。 那 么 ， 从 式 (28-3)， 用 超过 i, 的 时 间 退 出 非 


法 状态 的 概率 与 下 面 的 概率 相同 


| AV(0) | < exp| ==) (28-8) 





T, 


|AV(0) | 均匀 分 布 在 0 到 1 之 间 ， 用 超过 1, 的 时 间 达 到 稳 态 的 概率 很 简单 : 


(28-3) 


(28-4) 


(28-7) 
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P = exp( = =) (28-9) 
Ts 


例如 ， 假 设 有 一 个 触发 器 ，r. =100 ps， 从 非法 状态 退出 需要 等 待 i, =2 ns =207,, BFE 20 
T, 后 依然 留 在 非法 状态 ， 触 发 器 的 初始 电压 |AV(0) | 必须 小 于 exp( -20)。|AV(0) | 均匀 分 布 
在 区 间 [0, 1) ， 所 以 此 时 的 概率 为 已 =exp( -20)。 


28.4 亚 稳 态 的 演示 


对 许多 学 生 而 言 ， 亚 稳 态 只 是 一 个 抽象 的 概念 ， 直到 他 们 亲眼 看 到 它 。 到 那 时 ， 他 们 突然 
意识 到 ， 亚 稳 态 是 真实 存在 的 ， 它 会 偶然 出 现在 自己 的 触发 器 中 。 通 过 实验 室 操 作 或 课堂 演示 
都 可 以 做 好 这 个 。 我 希望 你 能 有 机 会 可 以 现场 体验 亚 稳 态 的 演示 ， 如 果 不 能 ， 那 么 本 节 至 少 会 
展示 实际 看 到 的 几 张 照片 。 

28-7 是 亚 稳 态 演示 电路 的 原理 图 。 该 电路 由 6 个 4000 系列 CMOS 集成 电路 、5 个 电阻 
和 3 个 电容 组 成 。 门 和 晶体 管 接线 端子 旁边 的 小 数字 是 集成 电路 芯片 的 引 脚 编 号 。 你 可 以 根据 
这 张 原理 图 很 容易 地 构建 自己 的 亚 稳 态 演示 电路 来 自己 重复 这 个 演示 实验 。 





压 控 延迟 线 
延迟 随 着 VC 的 增 大 而 增 大 

No Part Vdd GND 
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图 28-7 亚 稳 态 演示 电路 原理 图 。 该 电路 由 一 个 振荡 器 、 电 压 控制 延迟 线 和 两 个 RS 触发 器 组 
成 。 反 馈 的 作用 是 推动 受 测 触 发 器 进入 亚 稳 态 


演示 电路 实现 后 的 照片 如 图 28-8 所 示 。 电 路 板 底 部 从 左 到 右 依次 是 UL 、U2 和 U3。 电 路 
板 顶 部 依次 是 U4、U5 和 U6。 在 两 个 RS 触发 器 之 间 进 行 选择 的 双 刀 双 掷 开关 在 右 侧 ， 没 有 出 
现在 照片 中 。 


Ss š U2 U1 13, 
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这 个 电路 有 3 个 主要 部 分 : 一 个 振荡 器 、 一 对 电压 控制 的 延迟 线 和 两 个 RS 触发 器 。IC U1 
是 一 片 CD4093， 它 包括 4 个 带 施 密 特 触发 器 的 与 ”。.， ss 
JEJ. Ul 的 其 中 一 个 门 位 于 原理 图 的 最 左边 , 组 ee eco totes spans: 
成 了 一 个 张弛 振荡 器 。1 k 的 电阻 和 3.3 nF 的 电 2 ee 
容 确定 了 振荡 器 的 时 间 常 数 为 3.3 ks， 则 周期 约 
为 6 hs。 集 成 电路 U3 和 U2 连 成 了 电压 控制 的 延 
迟 线 。 这 部 分 电路 是 一 个 反 相 器 ， 它 带 有 PFET 
所 需要 的 电源 ，PFET 的 栅 极 连 到 了 控制 电压 Veo 
WV. 越 高 ， 通 过 PFET 的 电流 就 越 低 ， 反 相 器 输出 
的 上 升 沿 的 延迟 就 越 大 。Ul1 额外 的 门 和 U4 用 于 
缓冲 延迟 线 的 输出 ， 以 使 被 测 的 RS 触发 器 获得 
HRR EPA E eI Ta), Ua, A es co 
两 个 RS 触发 器 。 上 面 的 触发 器 由 U4 (WSE M TI: 

CD4011) 的 两 个 门 构成 ， 下 面 的 触发 咒 由 独立 的 ER odes 
晶体 管 U5 和 U6 (CD4007) 构成 。 图 28-8 用 一 块 原型 板 实现 亚 稳 态 演示 电路 

触发 器 的 输出 反馈 回来 控制 延迟 线 ， 以 驱动 触发 器 进入 亚 移 态 。 开 关 选 择 两 个 受 测 触发 器 
中 的 一 个 ， 通 过 RC 滤波 器 来 控制 电压 变量 延迟 线 。 所 选 触发 器 的 输出 Q 连 到 了 下 面 延迟 线 的 
控制 电压 上 ， 该 延迟 线 驱 动 与 非 门 ， 而 与 非 门 驱动 ON 输出 。 相 似 地 ， 所 选 触 发 器 的 输出 QN 
驱动 上 面 的 延迟 线 ， 而 该 延迟 线 驱 动 连接 到 Q 的 与 非 门 。 

这 一 反馈 连接 驱动 触发 器 进入 亚 稳 态 。 当 触发 器 的 输入 变 高 时 ， 速 度 更 快 的 输入 会 获胜 ， 
从 而 使 得 输出 变 低 。 这 又 反 过 来 进一步 降低 了 驱动 男 一 个 输入 的 延迟 线 的 控制 电压 ， 使 其 速度 
提高 ， 从 而 使 慢 的 输入 赶 上 快 的 输入 。 一旦 触发 器 处 于 亚 稳 态 ， 它 的 两 个 输出 Q 和 QN 经 常会 
同样 地 变 低 ， 使 电路 保持 平衡 状态 。 

图 28-9 展示 了 RS 触发 器 正在 进入 和 
脱离 亚 稳 态 。 该 图 是 示波器 工作 在 无 限 持 
续 模 式 下 的 屏幕 截图 。 在 这 种 模式 下 ， 示 
波 器 在 写 新 的 波形 时 保留 屏幕 上 旧 的 波形 ， 
即 在 一 段 时 间 里 累加 所 有 的 波形 。 水 平 标 
尺 是 每 栅 格 200 ns， 两 个 信号 的 垂直 标尺 
都 是 每 栅 格 2 V。 屏 幕 截图 时 ， 示 波 器 记录 
了 1 秒 。 振 荡 器 运行 在 约 400 kHz， 该 记录 
是 约 400 000 2 JL s HY 85 JI 

上 面 的 轨迹 是 RS 触发 器 的 一 个 输入 ， 
下 面 的 轨迹 是 它 的 一 个 输出 。 输 入 下 降 后 ”图 28-9 图 28-7 中 下 面 的 RS 触发 器 的 输入 和 输出 。 
约 250 ns, 输出 进入 了 亚 稳 态 ， 电 压 处 于 - 秒 钟 累加 的 波形 
GND 和 yp 的 中 间 。 触 发 器 离开 亚 稳 态 ， 以 指数 衰退 到 1 或 者 0， 就 像 图 28-5 所 示 。 在 大 部 分 
情况 下 ， 亚 稳 态 衰退 需要 约 250 ns。 但 是 , 在 一 些 情况 下 ， 亚 稳 态 衰退 需 时 约 400 ns。 这 反映 
出 ， 随 着 概率 的 降低 ， 初 始 状态 可 以 任意 接近 于 亚 稳 态 区 域 的 中 心 ， 因 此 需要 花费 任意 长 的 时 
间 来 衰退 。 在 这 张 图 中 ， 输 出 退回 到 高 的 情况 略 多 于 退回 到 低 的 情况 。 这 是 因为 电路 有 偏 移 ， 
使 得 初始 概率 分 布 偏离 了 中 心 

图 28-10 是 示波器 工作 1 小 时 以 后 的 屏幕 截图 ， 是 超过 十 亿 条 轨迹 的 又 加 。 在 这 数 十 亿 条 
中 ， 有 少数 一 些 已 经 非常 接近 于 亚 稳 态 区 域 的 中 心 ， 如 图 中 那 几 条 需要 800 ns 才能 退回 到 稳 态 
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的 轨迹 。 波 形 的 左边 被 填 满 ， 表 明 有 很 多 次 是 在 250 ~ 600 ns ZEH, Im 600 - 800 ns 之 间 的 
记录 逐渐 减少 ， 反 映 出 随 着 时 间 的 推移 ， 概 率 呈 指数 下 降 

即使 仅 有 十 亿 次 实验 ， 我 们 仍然 得 到 了 持续 时 间 长 达 800 ns 的 亚 稳 态 。 现 代 的 高 端 GPU 
芯片 有 成 千 上 万 个 触发 器 - 运行 在 1 GH; 以 上 , 一 个 超级 计算 机 可 能 有 20 000 个 类 似 的 芯片 
在 这 种 机 器 内 部 ， 每 秒 中 会 有 超过 10" 个 触发 器 时 钟 事件 发 生 ， 每 年 会 有 超过 10” 个 触发 器 时 
钟 事件 出 现 。 要 求 要 特别 小 心地 处 理 同 步 和 亚 稳 态 ， 是 因为 即使 是 非常 不 可 能 的 事件 ， 若 乘 以 
这 种 高 频率 ， 也 会 出 现 问题 。 

当选 择 由 四 与 非 门 CD4011 的 两 个 门 构成 的 RS 触发 名 时 ， 波 形 如 图 28-11 所 示 。 对 该 波形 
的 解释 我 们 留 到 习题 28. 13， 





图 28-10 图 28-7 中 下 面 的 RS 触发 器 的 输 图 28-11 图 28-7 上 面 的 RS 触发 器 由 四 与 非 
入 和 输出 。 一 小 时 累加 的 波形 [J CD4011 构成 ， 当 选择 该 触发 器 


时 的 输入 和 输出 波形 


小 结 


通过 本 章 理 解 了 触发 器 采样 异步 信号 时 发 生 的 亚 稳 态 和 失效 。 我 们 用 带 正 反馈 的 可 再 生 电 
路 构建 了 一 个 触发 器 模型 ， 看 到 了 这 个 模型 如 何 产生 两 个 稳 态 和 一 个 亚 稳 态 。 两 个 稳 态 相当 于 
spi aoa a aac gp Sy 而 另 一 个 为 低 。 在 亚 
稳 态 ， 触 发 器 的 两 个 内 部 节点 都 处 于 em, ， 也 不 是 低 。 像 稳 态 一 样 ， 亚 稳 态 
可 以 无 限期 地 持续 下 去 。 与 稳 态 不 同 的 是 ， et en 
而 进入 两 个 稳 态 其 中 之 一 。 正 如 处 于 山顶 部 的 球 ， 处 于 亚 稳 态 的 触发 器 可 以 永远 待 在 那个 位 
置 。 但 是 ， 如 果 球 或 者 触发 器 略微 移动 到 一 边 或 另 一 边 ， 它 就 会 从 山上 跌落 ， 进 入 稳 态 

我 们 推导 出 公式 来 估计 用 于 采集 异步 信号 的 触发 器 进入 或 脱离 亚 稳 态 的 速率 。 异 步 事件 发 
生 时 ， 进 入 亚 稳 态 的 概率 正好 是 事件 发 生 在 触发 器 的 建立 和 保持 窗口 中 的 概率 : 
t + by 
w. 

一 旦 触发 器 进入 亚 稳 态 ， 任 何 小 的 偏差 都 会 以 指数 增长 ， 每 7. HK efo TIF t 后 触发 
器 仍然 处 于 亚 稳 态 的 概率 为 

P. = exp( =) 


最 后 ， 我 们 看 到 了 亚 稳 态 的 一 个 演示 ， 示 波 器 的 波形 展示 了 触发 器 进入 和 脱离 亚 稳 态 。 








Pe, = 


E 








O (BÆ, 这 些 触 发 器 中 只 有 一 小 部 分 必须 处 理 异步 信号 
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文献 说 明 


关于 亚 稳 态 引发 问题 的 最 早 的 论文 之 一 是 参考 文献 [26]。 参 考 文献 [32] 给 出 了 该 问题 
的 更 详细 的 处 理 。 


习题 
28.1 稳定 时 间 ，I。 当 初始 电压 差 是 16 mV 时 ， 稳 定时 间 是 多 少 ? 
28.2 稳定 时 间 ，II。 当 初始 电压 差 是 0.16 pV 时 ， 稳 定时 间 是 多 少 ? 
28.3 最 大 电压 差 ,I。 一 个 亚 稳 态 系统 要 在 Tr, 内 稳定 到 AV=1 V， 那 么 最 大 的 初始 电压 差 是 多 少 ? 
28.4 最 大 电压 差 ，II。 一 个 亚 稳 态 系 统 要 在 3.57, 内 稳定 到 AV=1 V， 那 么 最 大 的 初始 电压 差 是 多 少 ? 
28.5 稳定 时 间 与 转换 时 间 。 假 设 一 个 触发 器 ， =t =500 ps, 7, =100 ps。 在 yY 轴 上 绘制 触发 器 的 数据 
转换 时 间 与 稳定 时 间 曲 线 图 。 假 设 从 — 500 ps 到 500 ps 系统 的 初始 Ar 在 1V 到 -17V 之 间 呈 线性 
变化 〈 如 图 28-1b 所 示 )， 稳 定时 间 应 该 反映 达到 | AV|=1 所 需 的 总 时 间 。 
28.6 KRP, I M i, =i =100 ps, fy =2 GHz 时 ， 异步 信号 变化 并 违反 触发 器 的 建立 和 保持 约束 的 
概率 是 多 少 ? 
28.7 KRH, I, t, =tp=20 ps, fy =4 GHz BF, 异步 信 号 变化 并 违反 触发 器 的 建立 和 保持 约束 的 
概率 是 多 少 ? 
28.8 KREE, IMa t, = =300 ps, fy =1 MHz Bf, 异步 信号 变化 并 违反 触发 器 的 建立 和 保持 约束 
的 概率 是 多 少 ? 
28.9 失误 频率 ，I。 规定 每 0. 01 s 仅 有 一 次 非法 的 异步 转换 ， 当 系统 中 1, =t, =100 ps, fy =2 GHz Rf, 
计算 万 的 最 大 值 ? 
28.10 失误 频率 ，I。 规 定 每 0.01 s 仅 有 一 次 非法 的 异步 转换 ， 当 系统 中 心 = 加 =20 ps, foy =4 GHz 时 ， 
HAS, 的 最 大 值 ? 
28.11 失误 频率 ，II。 规 定 每 0.01 s 仅 有 一 次 非法 的 异步 转换 ， 当 系统 中 i, =t =300 ps, fy =1 MHz 
hF, 计算 fh 的 最 大 值 ? 
28. 12 ”保持 在 非法 状态 的 概率 。 设 计 一 个 电路 ， 有 两 个 不 同 的 触发 器 可 供 选 择 。 触 发 器 1 AY 1, = 4, =50 ps, 
Ts =20 ps， 触 发 器 2 HI t, =, =250 ps, z, =10 ps。 在 下 面 的 情况 下 ， 你 分 别 会 选择 哪 种 触发 器 以 
使 失误 达到 最 小 ， 并 加 以 解释 。 
(a) t, =0 ps; 
(b) t, =50 ps. 
假设 f. =1 GHz, fa =10 MHz， 为 触发 器 1 和 触发 器 2 绘制 失误 概率 ， 它 是 i 的 函数 。 
28.13 振荡 的 亚 稳 态 。 解 释 图 28-11 的 波形 。( 提 示 : 看 与 非 门 CD4011 的 内 部 电路 原理 图 。) 
28.14 虚假 同步 器 。 你 公司 的 工程 师 建议 你 用 触发 器 ， 后面 跟 一 个 比较 器 ， 比 较 器 后 面 再 跟 第 二 个 触发 
器 ,来 自己 搭建 一 个 快速 同步 器 。 比 较 器 的 阅 值 设 为 0.2 V， 这 个 值 足够 低 ， 以 至 于 触发 器 的 半 
稳 态 输出 可 以 被 识别 为 逻辑 1。 这 样 做 可 以 可 靠 同步 一 位 信号 吗 ? 解释 你 的 答案 。 如 果 结 果 不 为 
零 ， 根 据 电路 参数 给 出 同步 失效 的 概率 。 
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在 同步 系统 中 ， 我 们 可 以 通过 遵守 建立 和 保持 时 间 的 约束 来 避免 触发 器 进入 非法 状态 或 
亚 稳 态 。 但 是 ， 当 采样 异步 信号 或 穿越 不 同 的 时 钟 域 时 ， 我 们 不 能 保证 会 满足 这 些 约束 条 
件 。 在 这 些 情况 下 ， 我 们 设计 同步 器 ， 通 过 等 待 退出 并 隔离 亚 稳 态 来 减少 同步 失效 发 生 的 
概率 。 

由 两 个 背靠背 触发 器 组 成 的 蛮 力 同步 器 常用 于 同步 单位 信号 。 第 一 个 触发 器 采样 异步 信 
号 ， 第 二 个 触发 器 隔离 第 一 个 触发 器 可 能 出 现 的 错误 输出 ， 直 至 所 有 非法 状态 都 可 能 已 经 退 
出 。 这 种 蛮 力 同步 器 并 不 被 用 于 多 位 信号 ， 除 非 它 们 用 格雷 码 编码 。 如 果 同 步 器 采样 时 传送 多 
个 位 ， 这 些 位 各 自 独立 完成 ， 就 有 一 些 位 在 传送 前 采样 ， 有 一 些 在 传送 后 采样 ， 这 样 可 能 会 导 
致 编码 错误 。 我 们 可 以 用 FIFO (先进 先 出 ) 同步 器 来 安全 地 同步 多 位 信号 。FIFO 既 可 以 同步 
信号 ， 也 可 用 于 流 控 ， 以 确保 在 一 个 时 钟 域 中 的 发 射 器 发 出 的 每 个 数据 都 能 被 在 另 一 个 时 钟 域 
中 的 接收 器 精确 地 采样 一 次 一 一 即使 两 个 时 钟 频率 不 同 。 


29.1 何 处 使 用 同步 器 

同步 器 用 于 两 个 完全 不 同 的 应 用 ， 如 图 29-1 所 示 。 首 先 ， 当 信号 从 一 个 真正 的 异步 源 过 
来 时 ， 在 它们 输入 到 同步 数字 系统 之 前 必须 进 
行 同步 。 例 如 ， 人 按 下 按钮 开关 产生 一 个 异步 
信号 。 该 信号 可 以 在 任意 时 刻 传送 ， 所 以 在 输 
和 同步 电路 前 必须 进行 同步 。 许 多 物理 检测 设 
备 也 确实 会 产生 异步 输入 。 光 电 探 测 器 、 温 度 
传感器 、 压 力 传感器 等 都 会 产生 输出 并 传送 ， 
它们 受 控 于 物理 过 程 ， 而 不 是 时 钟 。 = on 

图 29-1 在 异步 和 同步 系统 ( 左 侧 ) 之 间 需 要 同 

P MEEN PE — 4 步 器 ,在 芯片 内 部 和 外 部 的 时 钟 域 之 间 
时 钟 域 移 到 另 一 个 时 钟 域 。 一 个 时 钟 域 就 是 全 也 需要 同步 器 
部 与 一 个 时 钟 同 步 的 一 组 信号 。 例 如 ， 在 计算 
机 系统 中 ， 处 理 器 按时 钟 pelk 运行 ， 而 存储 系统 按 不 同 的 时 钟 melk 运行 ， 这 都 不 足 为 奇 。 而 
且 这 两 个 时 钟 的 频率 可 能 过 然 不 同 。 例 如 ，pelk 可 能 是 2 GHz, Iñ melk 是 800 MHz。 比 如 在 
pelk 时 钟 域 中 ， 那 些 与 pelk 同步 的 信号 不 能 被 直接 用 在 存储 系统 中 。 它 必须 首先 与 mclk 同步 。 
相似 地 ， 存 储 系统 中 的 信号 在 用 于 处 理 器 中 之 前 也 必须 首先 与 pclk 同步 。 

在 时 钟 域 之 间 移 动 信号 时 ， 包 括 两 种 完全 不 同 的 同步 任务 。 如 果 我 们 希望 移动 一 个 数据 序 
列 ， 而 且 序列 中 的 每 一 个 数据 都 必须 保留 ， 那 我 们 使 用 序列 同步 器 。 例 如 ， 要 从 处 理 器 向 存储 
系统 依次 发 送 8 个 单词 (数据 总 线 上 一 次 一 个 单词 )， 我们 需要 一 个 序列 同步 器 。 男 一 方面 ， 
如 果 希 望 监控 一 个 信号 的 状态 ， 我 们 需要 一 个 状态 同步 器 。 状 态 同步 器 将 需要 同步 的 信号 的 最 
新 样本 输出 到 它 的 输出 时 钟 域 。 为 了 使 处 理 器 可 以 监控 存储 系统 中 的 队列 深度 ， 我 们 使 用 状态 
同步 器 一 一 我 们 不 需要 队列 深度 的 所 有 采样 (一 个 时 钟 采 一 个 )， 只 要 最 新 的 一 个 样本 。 男 一 
方面 ， 在 两 个 子 系统 之 间 传送 数据 不 能 使 用 状态 同步 器 ， 因 为 它 会 丢失 一 些 元 素 而 重复 男 一 些 
元 素 。 
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29.2 BARA 
单位 信号 的 同步 通常 使 用 如 图 29-2 所 示 的 变 力 同步 器 实现 。 触 发 器 FF1 对 异步 信号 a 进 
行 采样 ， 产 生 输出 a,。 由 于 频率 高 ，FF1 将 会 进入 非法 状态 ， 因 而 信号 a, 是 不 安全 的 。 为 了 
保护 系统 的 其 余部 分 远离 不 安全 信号 ， 在 FF2 重新 采样 前 ， 我 们 等 待 一 个 (或 更 多 ) 时 钟 周 
期 ,使 得 FF1 从 任何 非法 的 状态 退出 ， 从 而 产生 输出 ao 
图 29-2 的 同步 器 工作 得 如 何 ?” 换 句 话说 ，a 
传送 后 ,a, 进入 非法 状态 的 概率 是 多 少 ? 只 有 当 
1) FFI 进入 了 非法 状态 2) FF2 重新 采样 a 前 
非法 状态 没有 退出 ， 这 种 情况 才 会 发 生 。FF1 jk 
入 非法 状态 的 概率 记 为 Pe 〈 见 式 (28-4) ) ， 在 等 
fs 0, 后 仍然 留 在 该 非法 状态 的 概率 记 为 P。( 见 式 29-2 由 两 个 背靠背 触发 器 组 成 的 瘟 力 同步 








(28-9) ) 。 因 此 ，FF2 进入 非法 状态 的 概率 为 器 。 第 一 个 触发 器 对 异步 信号 a 进行 

Py. = P,P, = (一 “je 人 = =) (29-1) 采样 ， 产 生 信 号 wv。 第 二 个 触发 器 在 

to T, 对 a, 重新 采样 前 等 待 一 个 (或 多 个 ) 

这 里 的 等 待 时 间 4, 不 是 一 个 完整 的 时 钟 周 期 ， 而 时 钟 周期 ， 以 使 第 一 个 触发 器 从 任何 
是 一 个 时 钟 周 期 减 去 所 需 的 开销 : 亚 稳 态 退出 ， 从 而 产生 同步 输出 a. 
Ë, = tç = t, = taoq (29-2) | 


HA, WRA t, =t =tio =T, =100 ps, t, =2 ns, 那么 FF2 进入 非法 状态 的 概率 为 
Pis = (a = ane eee s.s = 0.1 exp(- 18) = 1.5 x 10 
如 果 信 和 号 a 的 转移 频率 为 100 MHz， 那 么 失效 频率 为 
fa =f, Pes = (100 MHz)(1.5 x 10°) = 0.15 Hz (29-3) 
如 果 这 个 同步 失效 概率 不 够 低 ， 可 以 延长 等 待 时 间 使 其 降低 。 最 好 的 实现 方法 是 给 两 个 触 
发 吉 增 加 时 钟 使 能 ， 每 过 N 个 时 钟 周 期 使 能 一 次 ， 则 等 待 时 间 延 长 为 


L, = Nt, — t, — taco (29-4) 

在 上 面 的 例子 中 ， 等 待 两 个 时 钟 周 期 ， 失 效 概 率 和 频率 减 小 为 
Pa 三 letp(=38) = 3.1 «10 (29-5) 
frs = (100 MHz) (3.1 x 10°) = 3.1 x 10 °Hz (29-6) 


使 用 时 钟 使 能 延长 等 待 时 间 比 串联 使 用 多 个 触发 器 的 效率 更 高 。 因 为 使 用 时 钟 使 能 ， 只 需 
花费 触发 器 开销 + tc 一次， 否则 每 个 触发 器 都 要 花费 一 次 。 第 一 个 时 钟 周期 之 后 的 每 个 时 
钟 周 期 都 要 将 等 待 时 间 增 加 一 个 完整 的 和 。 使 用 串联 触发 器 ， 每 个 额外 的 触发 器 都 要 将 等 待 时 
间 延 长 2 =t = taco o 

失效 概率 能 到 多 低 ? 这 取决 于 系统 及 其 用 途 。 通 常 ， 我 们 想 要 同步 失效 的 概率 大 大 低 于 
其 他 系统 故障 的 概率 。 例 如 ， 在 远程 通信 系统 中 ,一 条 线路 的 误 码 率 是 10““， 那 么 一 个 失 
效 概率 Pes 等 于 10“ 的 同步 器 就 足够 了 。 对 于 一 些 功能 性 命 似 关 的 系统 ,平均 失效 时 间 
(MTTF =1/f:s) 必须 将 系统 的 使 用 寿命 与 系统 的 生产 数量 的 乘积 进行 长 时 间 的 比较 。 因 此 ， 
如 果 系 统 预计 工作 10 年 (3. 1 x10 s)， 并且 建 造 了 10 套 系统 ， 那 么 MTTF 要 远大 于 3. 1 x 
10° (fJ, f BWF 3 x10“)。 这 里 ， 我 们 确定 目标 fis =10-”( 每 10" 年 每 个 系统 
的 失效 次 数 少 于 一 次 ) 。 

29-1 蛮 力 同步 器 
一 个 系统 使 用 由 三 个 背靠背 触发 器 组 成 的 同步 器 ， 且 人 =1 kHz, f, =1 GHz, t, =t, = 
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50 ps, 7, =100 ps, taco =80 ps。 计 算 该 系统 的 平均 失效 时 间 。 
进入 亚 稳 态 的 概率 如 式 (28-4) 所 示 : 
_ (t, +t,\) _ (50 +50) _ 
P, = [ _ )= es )=0.1 
三 个 背靠背 触发 器 的 等 待 时 间 为 2 倍 的 时 钟 周 期 减 去 触发 器 开销 : 
t, = 2(t,, — t, — taa Í) = 2(1000 — 50 — 80) = 1740 ps = 17.47, 
因此 ， 各 事件 的 失效 概率 为 
Ps = P, Ps = (0.1) exp(=¢,/7,) = (0.1)exp( -= 17.4) 
= (0.1)(2.78 x10*) = 2.78 x 10° 





因而 ， 失 效 频率 为 
fe =f, Ps = (10°) (2, 78 x 10”) = 2.78 x 10 * Hz 
PVA, MTBF 为 
MTBF = 1/f, = 3.60 x 10° s 


29.3 多 位 信号 的 问题 

蛮 力 同步 器 对 于 同步 单位 信号 表现 出 众 ， 但 是 不 能 用 于 同步 多 位 信号 ， 除 非 该 信号 是 格雷 
人 码 编码 的 (也 就 是 ， 除 非 信 号 一 次 只 有 一 位 变化 )。 例 如 ,来 看 图 29-3 所 示 的 情况 。 由 时 钟 
clkl 控制 的 四 位 计数 器 的 输出 ent 与 第 二 个 频率 不 同 的 时 钟 clk2 进行 同步 。 假 设 当 clk2 EFH 
时 ,在 从 7 (0111) 计数 到 8 (1000) AY, ent 的 所 有 位 均 发 生变 化 一 一 寄存 器 R1 违反 了 建立 
和 保持 时 间 限 制 。R1 的 4 个 触发 器 都 进入 了 非法 状态 。 在 clk2 的 下 一 个 周期 里 ， 这 些 状 态 以 
极 高 的 概率 退回 到 0 或 1。 结 果 ， 当 clk2 再 次 升 高 时 ， 就 会 采样 到 一 个 合法 的 4 位 数字 信和 号 ， 
并 将 其 输出 到 cnt.。 | 








图 29-3 同步 多 位 信号 的 不 正确 做 法 。 由 时 钟 clk2 计时 的 同步 器 采样 由 时 钟 clkl 控制 的 
计数 器 。 在 传递 过 程 中 ， 当 多 位 信和 号 ent 改变 时 ,同步 输出 cnts 可 能 会 有 一 些 
位 变化 ， 而 其 他 位 不 变 ， 从 而 得 到 错误 的 结果 


问题 是 ， 输 出 cnt, 出 错 的 概率 极 高 。 对 于 ent 的 每 一 个 变化 位 ， 同 步 器 都 能 稳定 到 状态 0 
或 者 1。 在 这 种 情况 下 ， 当 4 位 都 变化 时 ， 同 步 器 的 输出 可 能 是 0 ~ 15 之 间 的 任何 一 个 数 。 

蛮 力 同步 器 可 以 用 于 多 位 信号 的 唯一 情况 就 是 确保 在 同步 器 的 时 钟 之 间 传 输 信 号 时 ， 最 多 
只 有 一 位 变化 。 例 如 ， 如 果 我 们 想 用 这 种 方式 去 同步 一 个 计数 器 ， 那 必须 使 用 格雷 码 计 数 器 ， 
每 次 计数 恰好 只 有 一 位 变化 。4 位 格雷 码 计数 器 的 计数 序列 为 0, 1, 3, 2, 6, 7, 5, 4, 12, 13, 
15, 14, 10, 11,9, 8。 序 列 相 邻 元 素 之 间 仅 有 一 位 改变 。 例 如 ， 第 八 次 转换 是 从 4 (0100) 变 
到 12 (1100) ， 这 次 转换 只 有 MSB 变化 。 如 果 用 4 位 格雷 码 计数 器 代替 图 29-3 中 的 计数 器 ， 
当 clk2 上 升 沿 到 来 时 ， 由 4 转换 到 12， 此 时 ， 只 有 RI 的 MSB 进入 非法 状态 ， 低 三 位 仍 将 保持 
稳定 在 100, MSB 稳定 到 0 或 1 中 的 任何 一 个 ， 输 出 都 是 合法 的 值 一 -4 或 12。 

产生 该 序列 的 四 位 格雷 码 计 数 器 的 Verilog 代码 如 图 29-4 所 示 。 
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module GrayCount4 (clk, rst, out) ; 
input clk, rst ; 
output [3:0] out ; 
wire [3:0] next ; 


DFF #(4) count(clk, next, out) ; 


“(out [1] “out [2] “out [3]) ; 

(out [0] ? ~(out[2]*out[3]) : out[1]) ; 
((out[1] & ~out[0]) ? ~out[3] : out[2]) ; 
(~(Jout[1:0]) ? out[2] : out[3]) ; 


assign next [0] 
assign next [1] 
assign next [2] 
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assign next [3] 
endmodule // GrayCount4 


图 29-4 4 位 格雷 码 计数 器 的 Verilog 描述 














29.4 FIFO 同步 器 


如 果 我 们 不 能 在 任意 多 位 信号 中 使 用 蛮 力 同步 器 ， 并 且 我 们 的 信号 不 是 格雷 编码 ， 那 么 ， 
我 们 如 何 将 信和 号 从 一 个 时 钟 域 移 到 另 一 个 时 钟 域 呢 ? 有 一 些 同 步 器 可 以 完成 这 个 任务 。 其 中 的 
关键 概念 就 是 消除 多 位 数据 通路 的 同步 。 同 步 被 转移 到 控制 通路 上 ， 该 通路 是 单位 或 格雷 编码 
的 信号。 

也 许 最 常见 的 多 位 同步 器 就 是 FIFO 
同步 器 。FIFO 同步 器 的 数据 通路 如 图 29-5 
所 示 。FIFO 同步 器 靠 一 组 寄存 器 RO 到 
RN 工作。 数据 在 输入 时 钟 的 控制 下 存 人 
寄存 器 ， 而 在 输出 时 钟 的 控制 下 从 寄存 
器 读 出 。 旦 指针 选择 下 一 个 要 写 人 的 寄 
存 器 ， 头 指针 选择 下 一 个 要 读 出 的 寄存 
器 。 数 据 增加 到 队列 尾部 ， 而 从 队列 头 
部 移 除 。 头 尾 指 针 都 是 格雷 编码 计数 器 ， 
被 译 码 为 独 热 编 码 以 驱动 寄存 器 使 能 端 
和 多 路 选择 器 的 选择 线 。 计 数 器 使 用 格 
雷 码 编码 就 可 以 在 控制 通路 上 使 用 蛮 力 
同步 器 对 它们 进行 同步 。 

带 4 个 寄存 器 (RO 到 R3) 的 FIFO 





clkout 


图 29-5 FIFO 同步 器 的 数据 通路 。 输 入 数据 由 输入 时 钟 


同步 器 的 操作 时 序 如 图 29-6 所 示 。 本 例 
中 的 输入 时 钟 clkin 比 输出 时 钟 clkout 更 
快 。 在 输入 时 钟 的 每 个 上 升 沿 ， 线 路 in 
上 的 一 个 新 数据 被 写 人 其 中 一 个 寄存 器 。 


clkin 置 和 人 寄存 器 RI，…，RN。 输 出 数据 由 输 
出 时 钟 clkout 在 寄存 器 中 选择 。 控 制 通路 〈 图 中 
未 显示 ) 确保 了 : 1) 数据 被 选中 输出 前 已 经 置 
和 了 寄存 器 ，2) 数据 在 读 取 之 前 不 会 被 覆盖 


被 写 人 的 寄存 器 由 尾 指针 选择 ， 该 指针 
以 格雷 码 模式 (0, 1, 3, 2, 0, …) 递增 。 第 一 个 数据 “ 被 写 入 寄存 器 RO0， 第 二 个 数据 4 
WEAR, 被 写 人 R3 ， 以 此 类 推 。 对 于 4 个 寄存 器 ,每 4 个 输入 时 钟 ， 各 寄存 器 的 输出 
有 效 一 次 。 

在 输出 端 ， 时 钟 clkout 的 每 个 上 升 沿 使 头 指 针 增加 ， 依 次 选取 每 个 寄存 器 。clkout 的 第 一 
个 上 升 沿 将 头 指针 置 为 0， 选 取 寄存 器 RO 的 内 容 a 并 输出 。RO 的 四 输入 时 钟 的 有 效 期 要 比 它 
被 选中 时 的 单 输出 时 钟 周期 长 ， 因 此 在 输出 端 看 不 到 输入 时 钟 的 变化 。 唯 一 的 输出 转换 来 自 于 
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aw sir mee 

"TEF a A fT 

head 

out 
K 29-6 带 4 个 寄存 器 的 FIFO 同步 器 的 操作 时 序 图 


(因此 也 同步 于 ) elkout。clkout 的 第 二 个 上 升 沿 使 头 指 针 加 到 1， 从 RI 选取 5 并 输出 ， 第 三 个 
EFREM R3 选取 c<， 以 此 类 推 。 

通过 使 用 多 个 寄存 器 来 延长 输入 数据 的 有 效 期 ，FIFO 同步 器 在 输出 端 选择 这 些 数据 ， 而 
不 需要 用 clkout 去 采样 那些 与 clkin 同步 变化 的 信号 。 因 此 ， 在 这 个 数据 通路 上 不 可 能 违反 建 
立 和 保持 时 间 。 

当然 ,我 们 无 法 消除 对 同步 的 需要 〈 和 同步 失效 的 可 能 性 ) ， 我 们 只 是 简单 地 将 它 转 移 到 
了 控制 通路 。 输 入 时 钟 的 运行 比 输出 时 钟 越 快 ，FIFO 同步 器 溢出 越 快 ， 除 非 使 用 流 控制 。 当 4 
个 寄存 器 都 满 时 ， 需 要 阻止 输入 再 往 FIFO 中 插入 数据 。 相 似 地 ， 如 果 elkout 比 输入 时 钟 快 ， 
“4 FIFO 为 空 时 ， 要 阻止 输出 从 FIFO 中 移 除数 据 。 

我 们 在 控制 通路 中 为 FIFO 增加 流 控制 。 包 含 控 制 通路 的 FIFO 的 完整 块 电 路 图 如 图 29-7 
所 示 (寄存 器 被 集中 在 了 RAM 阵列 中 ) ,控制 通路 本 喘 如 图 29-8 所 示 。 在 控制 通路 中 ， 我们 
为 两 个 接口 各 增加 了 两 个 流 控制 信号 。 在 输入 和 输出 接口 上 ， 如 果 发 送 器 从 数据 线 上 获得 了 有 
效 的 数据 ， 则 valid 信号 为 真 ; 如 果 接 收 器 准备 好 接收 新 数据 ， 则 ready 信号 为 真 。 仅 当 valid 
和 ready 都 为 真 时 ， 才 进行 一 次 数据 传送 。 在 输入 端 ，ivalid 是 输入 信号 ， 当 FIFO 不 满 时 iready 
有 效 。 在 输出 端 ，oready 是 输入 信号 ， 当 FIFO 不 空 时 ovalid 有 效 。 


clkout 


ovalid 





clkout 


图 29-7 FIFO 同步 器 的 控制 通路 图 29-8 FIFO 同步 器 控制 通路 的 时 钟 域 
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iready (不 满 ) 和 ovalid (不 空 ) 信号 是 通过 比较 头 尾 指针 产生 的 。 因 为 头 (head) 和 尾 
(tail) 处 于 不 同 的 时 钟 域 ， 所 以 这 个 比较 复杂 。 信 和 号 head 与 clkout 同步 ， 而 tail 与 clkin 同步 。 
我 们 使 用 一 对 多 位 蛮 力 同步 器 来 解决 这 个 问题 ， 一 个 同步 器 在 输入 时 钟 域 产生 一 个 head 
head; ， 男 一 个 同步 器 在 输出 时 钟 域 产生 一 个 tail 一 一 tail,。 只 允许 使 用 这 种 同步 化 方法 是 因为 
head 和 tail 都 是 格雷 码 编码 的 ， 因 此 在 任意 给 定 的 时 间 点 上 只 有 一 位 会 变化 。 此 外 ， 注 意 同步 
化 延迟 了 信号，head 和 tail, 比 head 和 tail 晚 两 个 时 钟 周期 。 

一 旦 我 们 在 同一 时 钟 域 中 得 到 了 head 和 tail， 就 可 以 对 它们 进行 比较 ， 从 而 确定 满 和 空 的 
状态 。 当 FIFO 为 空 时 ，head 和 tail 相等 ， 因 此 可 以 得 到 

assign empty = (head == tail_o) ; 

assign ovalid = !empty ; 


当 FIFO 为 满 时 ，head 和 tail 也 是 相等 的 。 因 此 ， 如 果 我 们 允许 使 用 所 有 的 寄存 器 ， 那 么 还 需 
要 再 增加 一 个 状态 来 区 分 这 两 种 情况 。 为 了 不 增加 复杂 度 ， 我 们 简单 地 声明 当 只 有 一 个 位 置 为 
空 时 FIFO 为 满 ， 得 到 


assign full = (head_i == inc_tail) ; 








assign iready = !full ; 


这 里 ，inc_tail 是 尾 指 针 按照 格雷 码 序列 加 一 后 的 结果 。 这 个 方法 总 会 使 一 个 寄存 器 为 空 。 例 
如 ， 对 于 4 个 寄存 器 ， 任 意 时 刻 ， 只 人 允许 三 个 寄存 器 包含 有 效 的 数据 。 尽 管 有 这 一 缺点 ， 但 这 种 
方法 仍 常常 被 优先 选用 ， 因 为 当 head = = tail 时 ， 为 了 区 分 满 和 空 ， 需 要 维持 和 同步 额外 的 状 
AS, 这 有 较 高 的 复杂 度 。 我 们 为 读者 留 了 习题 29. 10， 该 题 中 设计 的 FIFO 所 有 位 置 都 被 填 满 了 。 

FIFO 状态 的 说 明 如 图 29-9 所 示 。 图 29-9a 展示 了 当 了 IFO 为 空 时 ， 头 尾 指针 的 状态 。 在 
图 29-9b 和 图 29-9c 中 ， 向 FIFO 中 增加 数据 ，tail 增加 。 在 图 29-9d F, FIFO 只 有 一 个 位 置 为 
空 ，( 在 我 们 的 实际 使 用 中 ) 会 被 宣称 为 ftll， 而 且 不 会 接受 新 的 数据 。 在 图 29-9e KH, FIFO 
全 满 ， 且 head = tail。 在 图 29-9a 和 图 29-9e 中 ， 头 尾 指针 均 相 等 ， 但 前 者 代表 FIFO 为 空 ， 而 
后 者 显示 为 满 。 必 须 维持 额外 的 状态 来 区 分 这 两 种 情况 。 
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图 29-9 FIFO 状态 。a) FIFO 425, head = tail, b) 插入 一 个 数据 后 。c) 插入 两 个 数据 后 。 
d) 快 满 时 ，head =ine (tail), e) 全 满 时 ，head = tail 
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FIFO 同步 器 的 Verilog 代码 如 图 29-10 所 示 。 将 FIFO 的 宽度 和 深度 参数 化 为 : 默认 带 8 个 
寄存 器 ，8 位 宽 。 同 步 RAM 模块 包含 8 个 寄存 器 ， 图 中 未 示 出 。 由 时 钟 clkout 控制 的 寄存 
器 保存 head， 由 时 钟 clkin 控制 的 寄存 器 保存 tai1l。 一 对 蛮 力 同步 器 创建 信号 head_i 和 
tail_o。 一 对 三 位 的 格雷 码 增 量 器 (Verilog 代码 如 图 29-11 所 示 ) 使 head 和 tail 按照 格 
雷 码 序 列 递 增 ， 从 而 产生 inc_head 和 inc_tail。 注 意 ， 如 果 将 该 编码 方式 用 于 深度 大 于 8 
个 寄存 器 的 FIFO， 那 么 就 需要 宽度 更 大 的 格雷 码 增 量 器 ，GrayInc3 则 不 会 被 参数 化 。 在 下 
一 段 代 码 中 ， 流 控制 信号 iready 和 ovalid 的 计算 如 上 文 所 述 。 最 后 ， 计 算得 到 head 和 
tail 的 次 态 。 仅 当 valid All ready 信号 各 自 的 接口 状态 均 为 真 时 ，head Mtail 才 递 增 。 





module AsyncFIFO(clkin, rstin, in, ivalid, iready, 


clkout, rstout, out, ovalid, oready) ; 


parameter n = 8 ; // FIFORE 
parameter m = 8 ; // FIFO 深 度 
parameter lgm = 3 ; // 指针 域 宽度 


input clkin, clkout, rstin, rstout, ivalid, oready ; 
output iready, ovalid ; 





input [n-1:0] in ; 
output [n-1:0] out ; 


// 字 从 尾部 (tail) HA, ALM (head) HR 

// head_i/tail_oXhead/tailf HA 7 3t ti m Fik 
// inc_x 是 head/tail 按 格雷 码 递 增 

wire [lgm-1:0] head, tail, next head, next tail, head i, tail_o ; 
wire [lgm-1:0] inc head, inc tail ; 





// 双 端 口 RAM 保 存 数 据 
DP_RAM #(n,m,lgm) mem(.clk(clkin), .in(in), .inaddr (tail[lgm-1:0]), 
.wr (iready&ivalid) , 
.out (out), .outaddr(head[lgm-1:0])) ; 





// head 的 时 钟 为 output ，tail 的 时 钟 为 nput 
DFF #(lgm) hp(clkout, next head, head) ; 
DFF #(lgm) tp(clkin, next tail, tail) ; 


// 同步 器 
BFSync #(lgm) hs(clkin, head, head i) ; // tail 域 中 的 head 
BFSync #(lgm) ts(clkout, tail, tail_o) ; // headj FP tail 


// 格雷 码 增 量 器 
GrayInc3 hg(head, inc_head) ; 
GrayInc3 tg(tail, inc_tail) ; 


// iready 指 示 是 否 不 满 ，oready 指 示 是 否 不 空 
// 输入 时 钟 (input clock) 用 于 满 ( full ) 检测 
// 当 head 指 向 tail 的 下 一 个 位 置 ， 则 表示 满 


assign iready = !(head i == inc tail) ; 








图 29-10 FIFO 同步 器 的 Verilog 描述 
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// 输出 时 钟 (output clock) AFZ (empty) 检测 
assign ovalid = ! (head == tail_o) ; // 输出 ck 


// 插入 成 功 ，tail 加 1 


assign next tail = rstin ? 0 : (ivalid & iready) ?'inc_tail : tail ; 


// 移 除 成 功 ，head 加 1 
assign next head = rstout ? 0 : (ovalid & oready) ? inc_head : head ; 


endmodule 





图 29-10 (#) 


module GrayInc3(in, out) ; 
input [2:0] in ; 
output [2:0] out ; 
assign out [0] “(in({1)]*in[2]) ; 
assign out [1] infol ? “in[2] : in [i] ; 
assign out [2] “in[0] ? in{1] : in[2] ; 
endmodule 


图 29-11 三 位 格雷 码 增 量 器 的 Verilog 描述 


FIFO 同步 器 的 操作 如 图 29-12 的 波形 所 示 。 在 输入 端 ， 复位 后 ，iready 变 为 真 ， 表 示 
FIFO 不 满 ， 因 此 可 以 接收 数据 。 两 个 周期 后 ，ivalid 82k, 7 个 数据 元 素 被 插入 了 FIFO 中 。 
此 时 ，FIFO 8, iready 变 为 低 电 平 。 每 插入 一 个 数据 字 ，tail 按 三 位 格雷 码 序列 递增 。 注 
意 ，o_tail 比 tail 迟 两 个 输出 时 钟 周 期 。 之 后 ， 随 着 数据 字 在 输出 端 从 FIFO 中 移 走 ， 
iready 再 次 变 高 ， 就 可 以 插入 其 他 数据 字 。09 插入 后 ， 信 号 valid 变 为 低 电 平 持 续 三 个 时 
钟 周期 。 在 此 期 间 ， 即 使 ready 为 真 ， 数 据 也 不 能 输入 。 在 仿真 结束 前 , 输入 (其 以 更 快 的 
时 钟 速率 运行 ) 先 于 输出 获得 了 7 个 字 ，iready 变 为 低 电 平 。 
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图 29-12 29-10 所 示 FIFO 同步 器 的 仿真 波形 
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在 输出 端 ，ovalia AAR, das FIFO 不 空 ， 直 到 输入 端 插入 第 一 个 数据 的 两 个 输出 周 
Wa, ovalid 才 变 高 。 这 是 因为 信号 tail_o 的 同步 器 延迟 ， 而 ovalid 是 从 tail_o 得 出 
的 。 在 仿真 中 ,我 们 等 待 直到 FIFO 变 满 ， 然 后 每 隔 一 个 周期 移 除 一 个 字 ， 共 移 除 5 个 。 注 意 ， 
从 移 除 第 一 个 字 (01) 开始 ， 需 要 花费 两 个 输入 周期 来 使 iready 变 高 。 这 是 由 于 信号 head_i 
的 同步 器 延迟 ,而 iready 是 从 head_i 得 到 的 。 移 除 字 05 JG, iready 一 直 保 持 高 电 平 ， 而 
且 每 个 周期 移 除 一 个 字 。 

例 29-2 FIFO 深度 

来 看 一 个 FIFO 同步 器 ， 它 使 用 由 两 个 背靠背 触发 器 组 成 的 变 力 同步 器 来 同步 头 尾 指针 。 
假设 输入 和 输出 时 钟 运行 在 近似 的 频率 (410%), MAS FIFO 深度 最 小 为 多 少时 可 支持 数 
据 的 全 速率 传输 ? 

FIFO 必须 足够 深 ， 以 便于 当时 钟 的 相对 相位 处 于 最 糟 情况 时 ， 在 头 指 针 同 步 到 输入 域 之 
前 ， 输 入 端 不 会 看 到 FIFO 满 。 因 此 ，FIFO 深度 必须 为 5 一 一 要 足够 深 以 便 包 含 来 回 的 延迟 ， 包 
括 : (a) 尾 同 步 器 到 输出 域 (两 个 周期 ); (b) 输出 逻辑 对 ovalid 信号 做 出 反应 和 head_o iš 
增 的 一 个 时 钟 周 期 ;，(c) 头 同 步 器 回 到 输入 域 (两 个 周期 )。 每 个 同步 器 的 延迟 是 两 个 周 
期 一 一 同步 器 的 每 个 触发 器 延迟 一 个 周期 。 假 设 输入 和 输出 时 钟 近似 对 齐 一 一 这 是 最 坏 的 情 
况 。 在 相对 相位 最 好 的 情况 下 ， 整 个 同步 器 的 延迟 会 是 3 个 周期 而 不 是 4 个 。 

假设 时 钟 几 乎 对 齐 ， 总 延迟 及 所 需要 的 FIFO 深度 如 表 29-1 所 示 的 时 序 表 所 示 。FIFO RA 
为 空 ， 两 个 指针 都 为 0。 在 周期 0，ivalid 有 效 ， 向 FIFO 中 插入 一 个 字 ， 使 得 周期 1 中 的 
tail_i 递增 到 1。 两 个 周期 后 ， 在 周期 3，tail_o 增加 到 1， 使 得 ovalia 有效， 表明 FIFO 
不 为 空 。 在 周期 3 中 ， 输 出 移 除 一 个 字 ， 使 得 head_o 在 周期 4 中 增加 到 1。 同 步 器 延迟 之 后 ， 
head_i 在 周期 6 中 加 1。 

+ 29-1 HAF) T-H Pp tail_i-head_i, 它 是 输入 看 到 的 保存 在 FIFO 中 的 字数 。 虽 
然 稳 态 时 FIFO 中 仅 有 三 个 字 ， 由 于 同步 延迟 ， 输 入 最 多 看 到 占用 5 个 字 的 位 置 ， 而 输出 看 到 
tail o =head o， 仅 占用 了 一 个 字 。 除 非 当 FIFO 的 深度 至 少 为 5， 否 则 输入 将 看 到 满 状 态 ， 
在 同步 头 指针 指示 输出 移 除 了 第 一 个 字 之 前 ， 将 停止 输入 。 


表 29-1 例 29-2 的 FIFO 的 时 序 表 ， 展 示 了 从 FIFO 中 插入 和 移 除数 据 所 用 的 时 间 











周期 tail_i tail_o head_o head_i T-H 说 明 
0 0 0 0 0 0 初始 状态 
1 1 0 0 0 1 插入 第 一 个 元 素 
2 2 0 0 0 2 
3 3 1 0 0 3 输出 不 为 空 
4 4 2 1 0 4 
5 5 3 2 0 5 
6 6 4 3 1 5 头 递增 到 输入 
小 结 


在 本 章 中 ， 你 看 到 了 如 何 安全 地 同步 异步 事件 及 在 不 同时 钟 域 之 间 传 递 信号 。 虽 然 不 可 能 
将 同步 失效 的 概率 减 小 到 零 ,” 但 是 通过 设计 合适 的 同步 器 可 以 使 其 任意 小 。 典 型 地 ， 同 步 器 
被 用 于 数字 系统 的 异步 输入 中 和 时 钟 域 边界 上 。 





O ”除非 完全 避免 同步 化 。 
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变 力 同步 器 经 过 采样 、 等 待 、 重 采样 来 同步 单位 信号 。 采 样 触发 器 采样 异步 信号 ， 在 每 次 
传送 中 进入 亚 稳 态 的 概率 是 Pt。 等 待 适量 的 时 间 t, 以 允许 亚 稳 态 退 出 ， 然 后 用 第 二 个 触发 器 
对 第 一 个 触发 器 的 输出 重 采 样 。 通 过 选择 尽 可 能 大 的 等 竺 间隔， 可 以 使 得 同步 失效 的 概率 P = 
PP 任意 小 。 

蛮 力 同步 器 不 能 用 于 多 位 同时 变化 的 多 位 信号 ， 因 为 它 独立 采样 各 位 。 因 此 ， 输 出 中 的 一 
些 位 可 能 来 自 旧 字 ， 而 其 余 位 可 能 来 自 新 字 。 蛮 力 同步 器 只 能 用 于 以 格雷 码 编 码 的 多 位 信号 
( 即 一 次 只 有 一 位 变化 ) 中 。 

任意 多 位 信号 可 以 用 FIFO 同步 器 进行 同步 。 字 插入 输入 时 钟 域 的 FIFO 中 ， 从 输出 时 钟 域 
的 FIFO 中 移 除 。 同 步 化 只 需要 在 两 个 时 钟 域 之 间 传 送 关 和 尾 指 针 以 检查 空 和 满 状态 。 可 以 通 
过 格雷 码 编 码头 和 尾 指针 并 用 蛮 力 同步 器 对 它们 进行 同步 来 实现 。 


文献 说 明 


同步 器 的 类 型 比 我 们 在 此 讨论 的 更 多 。 看 参考 文献 [32] 的 一 项 调查 。 虽 然 同步 化 问题 
已 有 几 十 年 的 历史 , 但 关于 这 个 专题 经 常 还 会 开展 一 些 新 工作 [30]. 


习题 

29.1 HARMS, 1, 一 个 系统 ,/, =200 MHz, fa =2 GHz， 等 待 一 个 周期 进行 同步 ， 计 算 平均 失效 时 
间 。 所 用 触发 器 的 参数 如 表 29-2 所 示 。 

29.2 蛮 力 同步 器 ，I。 一 个 系统 , 人 =200 MHz, f =2 GHz， 等 待 5 个 周期 进行 同步 ， 计 算 平 均 失 效 时 
间 。 所 用 触发 器 的 参数 如 表 29-2 所 示 。 

29.3 RAMPS, HI, 一 个 系统 , fı =200 MHz, fy =2 GHz， 使 用 5 个 背靠背 触发 器 进行 同步 ， 计 算 
平均 失效 时 间 。 所 用 和 触发 器 的 参数 如 表 29-2 所 示 。 

29.4 AMPS, IV. 一 个 系统 ,，f, =200 MHz, fy =2 GHz， 在 半 对 数 轴 上 描绘 平均 失效 时 间 ， 它 是 
同步 化 所 用 周期 数 的 函数 。 

29.5 变 力 同步 器 ，V。 设计 一 个 起 捕 器 ， 它 所 用 的 异步 信号 每 分 钟 跳动 达 200 次 ， 用 参数 如 表 29-2 所 
示 的 触发 器 和 1CHz 的 时 钟 进行 同步 9 实际 上 ， 有 超过 107 个 起 搏 器 ， 其 寿命 为 30 年 。 为 了 使 平 
均 失 效 时 间 大 于 所 有 起 搏 器 的 总 寿命 ， 同 步 器 必须 等 待 多 少 个 周期 ? 


表 29-2 习题 所 使 用 的 触发 器 参数 


t, 50 ps 
th 20 ps 
7, 40 ps 
taco 20 ps 


29.6 一 次 且 仅 一 次 同步 器 。 设计 一 个 一 次 且 仅 一 次 同步 器 。 该 电路 接受 异步 输入 a 和 时 钟 ck， 输 出 信 
号 在 输入 a 的 每 一 个 上 升 沿 恰好 输出 一 个 时 钟 周期 的 高 电 平 。 

29.7 多 位 同步 器 ,1。 当 用 二 位 蛮 力 同步 器 跨 时 钟 域 传送 二 位 格雷 码 信 号 时 ， 位 切换 最 少 需要 花费 多 少 
时 间 ? 即 格雷 码 传送 的 最 大 时 钟 频率 是 多 少 ? 

29.8 多 位 同步 器 ，I。 厌 烦 了 不 断 地 编码 数据 以 使 得 每 次 仅 传送 一 位 ， 你 决定 构建 一 个 不 同 的 系统 从 
一 个 时 钟 域 向 另 一 个 时 钟 域 发 送 数 据 。 你 将 从 输入 时 钟 域 (周期 为 ,) 向 蛮 力 同步 器 发 送 8 位 
(包括 不 同 的 传输 延迟 或 数据 扭曲 i) 和 一 个 有 效 信号 到 输出 时 钟 域 (周期 为 4, )。 与 输出 相连 的 
模块 会 在 同步 有 效 为 高 时 在 输出 时 钟 的 第 一 个 上 升 沿 采样 数据 位 。 画 出 以 这 种 方式 发 送 8 位 数据 





O “实际 的 起 搏 器 不 在 这 个 时 钟 速率 附近 运行 ,我 们 用 这 个 值 来 举例 。 
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的 波形 图 ， 并 标 出 所 有 相关 的 时 序 约束 。 确保 在 有 效 信 号 有 效 前 有 足够 的 时 间 将 数据 同步 到 输 
出 域 。 
体温 计 编 码 同步 。 设 计 一 个 模块 ， 用 它 来 同步 图 1-7c 所 示 的 8 位 体温 计 编 码 信号 。 输 入 应 该 是 位 
于 输入 时 钟 域 中 的 两 个 时 钟 increment 和 decrement， 输 出 应 该 是 8 位 信和 号。 确保 不 使 用 与 输入 域 有 
逻辑 关系 的 输出 域 中 的 任何 状态 。 
FIFO 同步 器 。 修 改 FIFO 同步 器 逻辑 以 允许 其 可 以 填 满 最 后 一 个 位 置 。 你 需要 增加 状态 来 对 head 
= tail 时 FIFO 的 满 或 空 状 态 进 行 编 码 。 
空 / 满 位 。 设 计 并 编码 一 个 FIFO 同步 器 ， 为 每 个 寄存 器 设置 一 个 指示 位 来 代替 头 尾 指针 。 当 输入 
向 寄存 器 写 一 个 值 时 ， 相 应 的 指示 位 标记 为 满 ， 当 输出 读 取 一 个 值 时 ， 相 应 的 指示 位 标记 为 空 。 
在 每 个 时 钟 域 中 都 需要 一 组 标志 位 。 假 设 可 以 安全 地 异步 读 RAM, 但 是 在 时 钟 域 1 中 可 以 同步 
写 RAM, 在 共享 RAM 中 你 需要 为 4 个 输入 保留 空间 。 
FIFO RA, L, KA FIFO 同步 器 ， 它 使 用 由 3 个 背靠背 触发 器 组 成 的 蛮 力 同步 器 来 同步 头 尾 指 
针 。 假 设 输入 和 输出 时 钟 运行 在 近似 相同 的 频率 ( +10% ) FIFO 深度 最 小 为 多 少时 可 以 支持 数 
据 以 全 速率 传输 ? 
FIFO 深度 ，I。 来 看 FIFO 同步 器 ， 它 使 用 由 4 个 背靠背 触发 器 组 成 的 亦 力 同步 器 来 同步 头 尾 指 
针 。 假 设 输入 和 输出 时 钟 运行 在 近似 相同 的 频率 ( 土 10% ) FIFO 深度 最 小 为 多 少时 可 以 支持 数 
据 以 全 速率 传输 ? 
时 钟 塞 ，I。 各 模块 以 自己 的 时 钟 速率 运行 ,来 看 模块 管道 。 在 阶段 之 间 使 用 FIFO 同步 器 的 一 种 
替代 做 法 是 停止 各 阶段 的 时 钟 以 确保 输入 和 输出 之 间 的 数据 传输 免 于 同步 失效 。 设 计 一 个 时 钟 塞 
模块 ， 它 是 异步 电路 ， 它 与 延迟 线 一 起 为 这 个 管道 阶段 产生 时 钟 。 你 的 模块 应 该 包括 来 自 于 前 一 
个 管道 阶段 的 输入 ivalid， 来 自 于 下 一 个 管道 阶段 的 oready， 来自 于 延迟 线 的 delay。 和 来 自 于 该 管 
道 阶段 逻辑 的 done。 它 应 该 为 前 一 个 管道 阶段 产生 输出 iready， 为 下 一 个 管道 阶段 产生 ovalid， 为 
延迟 线 产 生 delayi。 你 可 以 假设 延迟 线 的 延迟 大 于 该 管道 阶段 最 小 周期 的 一 半 。 
由 于 ready 和 valid 信号 没有 公共 时 钟 做 参考 ， 你 的 模块 应 该 遵循 四 阶段 流 控 制 。 第 1 阶段 ， 
一 个 模块 使 它 的 vaid 信号 有 效 来 表示 输出 了 一 个 有 效 的 数据 ，valid 信和 号 必须 保持 高 电 平 直到 第 2 
阶段 ， 此 时 接收 模块 使 它 的 ready 信号 有 效 ， 接 受 该 数据 。ready 信号 必须 保持 高 电 平 直到 第 3 阶 
段 ， 此 时 发 送 模 块 使 它 的 valid 信号 变 低 。 最 后 ，valid 必须 保持 低 电 平 直 到 第 4 阶段 ， 此 时 发 送 
模块 使 它 的 ready 信和 号 变 低 。9 
时 钟 塞 ，II。 用 模块 之 间 的 两 阶段 流 控制 来 重 做 习题 29. 14。 在 两 阶段 流 控制 中 ， 发 送 模块 翻转 它 
的 valid 信号 来 表示 输出 了 一 个 新 数据 ， 而 接收 模块 翻转 它 的 ready 信和 号， 接受 这 个 数据 。 由 于 在 
信号 的 上 升 和 下 降 沿 已 完成 了 信和 号 传送 ， 所 以 不 需要 等 待 信号 返回 零点 。 
融会 贯通 。 设 计 并 实现 一 个 有 用 的 、 赚 钱 的 、 有 趣 的 和 /或 非常 酷 的 数字 系统 。 


由 于 在 异步 环境 中 ， 这 些 流 控 制 信号 的 意图 略 有 不 同 ， 它 们 在 异步 系统 中 也 常常 被 称 为 request 和 acknowledge 
(也 简称 为 req 和 ack) 。 为 了 避免 混淆 ， 我 们 在 此 仍 按 惯 例 用 valid 和 ready, 
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Verilog 编码 风格 





在 本 附录 中 ， 我 们 将 对 Verilog 编码 风格 提出 一 些 指导 性 原则 。 经 过 多 年 的 数字 系统 设计 
教学 和 企业 项 目 开 发 ， 这 些 原则 已 经 被 证 实 不 仅 能 够 有 效 减 少 工 作 量 ， 还 能 设计 出 较 好 的 产 
品 ， 而 且 设计 成 果 具 有 很 好 的 可 读 性 和 可 维护 性 。 本 书 中 很 多 Verilog 实例 都 采用 了 这 种 风格 。 
该 编码 风格 有 利于 生成 可 综合 的 模块 ， 而 这 些 模块 最 终 要 映射 到 实际 的 硬件 中 。 本 附录 还 介绍 
了 一 个 用 于 测试 平台 的 独特 编码 风格 。 

本 附录 内 容 不 是 Verilog 语言 的 参考 手册 。 在 网 上 可 以 找到 许多 优秀 的 Verilog 参考 文献 。 
相反 ， 这 一 部 分 提供 的 是 一 系列 的 原则 和 样式 规则 ， 它 可 以 帮助 设计 人 员 编 写 出 正确 的 、 可 维 
护 的 代码 。 参 考 手册 是 用 来 说 明 什 么 样 的 Verilog 代码 是 合法 的 ， 而 本 附录 主要 说 明 的 是 : 什 
么 是 好 的 Verilog 代码 。 在 这 里 我 们 会 给 出 一 些 好 的 代码 和 煤 粒 的 代码 ,但 这 些 代 码 的 语法 都 
是 正确 的 。 


A.1 基本 原则 

这 里 先 介 绍 一 些 基 本 原则 。 

知道 状态 应 放 在 哪里 : 设计 时 对 于 每 一 位 状态 都 应 该 显 式 说 明 。 在 我 们 推荐 的 编码 风格 
中 ， 要 求 所 有 状态 明确 地 放 在 触发 器 或 寄存 器 模块 中 ， 其 他 模块 则 是 纯 组 合 逻 辑 。 这 种 方法 可 
避免 在 编写 用 always@ (pesedge clk) 括 起 来 的 顺序 模块 时 出 现 大 量 问题 。 当 条 件 语句 的 
所 有 分 支 中 有 未 赋值 变量 时 ， 检 查 推断 出 的 锁 存 器 也 会 容易 得 多 。 

了 解 模 块 的 综合 结果 : 编写 一 个 模块 时 ， 你 应 该 能 够 想到 这 个 模块 将 会 生成 什么 样 的 逻辑 。 
如 果 采 用 结构 化 方式 描述 模块 ， 通 过 导线 与 其 他 模块 连接 在 一 起 ， 综 合 结果 很 容易 预见 。 小 的 行 
为 模块 和 算术 模块 也 是 可 以 预测 的 。 由 于 无 法 预测 结果 ， 应 该 尽量 避免 出 现 大 的 行为 模块 。 

确保 代码 具有 良好 的 可 读 性 : 在 项 目 设计 过 程 中 ， 可 能 需要 修改 某 个 模块 。 修 改 的 难 易 程 
度 要 看 代码 的 可 读 性 如 何 。 第 一 ， 模 块 的 功能 应 该 明确 ， 例 如 ， 对 于 真 值 表 是 使 用 case 语句 
还 是 casex 语句 。 第 二 ， 信 号 名 和 常量 名 要 具有 一 定 的 描述 性 。 第 三 ， 代 码 的 注释 要 有 助 于 理 
解 代 码 ， 而 不 是 直接 把 代码 复制 过 来 作 注 释 。 当 你 去 编辑 一 个 注释 清晰 的 模块 时 ， 很 容易 理解 模 
块 的 功能 ， 而 且 修 改 起 来 也 很 容易 。 如 果 模 块 的 编码 很 奇怪 ， 而 且 有 很 多 含义 不 清 的 名 字 时 ， 你 
会 发 现 很 难 理解 代码 。 尤 其 是 当 你 知道 这 是 自己 很 久 以 前 编写 的 代码 时 ， 会 变 得 更 加 诅 丧 。 

防御 性 设计 : 要 考虑 到 设计 的 模块 可 能 会 出 现 的 错误 。 输 入 和 输出 的 边界 情况 是 什么 ? Tü 
保 模 块 可 以 处 理 每 一 种 情况 。 包 括 对 必须 保持 不 变 的 变量 及 能 够 检查 出 的 错误 情况 设置 断言 。 

发 挥 综合 器 的 作用 : 现代 逻辑 综合 工具 (如 Synopsys Design Compiler?) 在 小 的 组 合 逻 辑 
电路 (最 多 约 10 个 输入 ) 和 运算 电路 的 优化 上 做 了 大 量 工 作 。 除 非 极 特殊 情况 ， 否则 手动 优 
化 这 些 模块 毫 无 任何 意义 。 对 模块 描述 时 应 采用 一 种 非常 明确 的 行为 方式 ， 这 样 才能 发 挥 工具 
的 特长 。 

了 解 综合 器 不 能 做 什么 : 现代 综合 工具 不 擅长 做 高 层次 的 优化 。 它 们 不 知道 如 何 划 分 逻辑 
或 者 何 时 共享 功能 单元 。 综 合 器 无 法 对 某 一 功能 是 放 在 一 个 周期 内 完成 还 是 设计 成 流水 线 用 几 
个 周期 来 完成 做 出 权衡 ， 而 这 正 是 人 类 设计 师 的 价值 所 在 。 因 此 不 要 指望 让 工具 做 设计 师 的 工 
作 ， 反 之 亦 然 。 


[592] 
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A.2 所 有 状态 应 该 显 式 地 声明 为 寄存 器 型 

应 该 将 设计 中 的 所 有 状态 显 式 声明 为 寄存 器 或 触发 器 。 图 A-1 给 出 一 个 正确 实例 (改编 自 
图 16-3) 。 该 例 中 将 输入 next 和 输出 out 声明 为 一 个 4 位 的 寄存 器 。 下 一 状态 的 产生 由 一 个 
赋值 语句 完成 。 





module BadCounter(clk, rst, out) ; 
parameter n=4 ; 








module Good_Counter(clk, rst, out) ; input rst, clk ; 
parameter n=4 ; output [n-1:0] out ; 
input rst, clk ; reg [n-1:0] out ; 


output [n-1:0] out ; 
always @(posedge clk) begin 





wire [n-1:0] next = rst ? 0 : Out+l 3 out <= rst ? 0 + out+l ; 
DFF #(n) count(clk, next, out) ; end 
endmodule endmodule 
图 A-1 采用 正确 风格 编写 的 计数 器 模块 。 模 图 A-2 ”采用 不 正确 风格 编写 的 时 序 逻 
块 count 的 类 型 是 DFF， 计 数 器 的 状 辑 。 状 态 与 下 一 状态 的 生成 混 
态 存 人 显 式 声明 的 寄存 器 中 在 一 个 always 语句 中 


避免 采用 图 A-2 中 的 风格 编写 模块 。 本 图 中 的 模块 将 状态 生成 (always@ (pesedge 
clk) 块 中 的 赋值 语句 ) 与 下 一 状态 函数 的 定义 混在 一 起 。 

我 们 坚持 使 用 图 A-1 的 风格 编程 是 因为 它 可 以 帮助 设计 人 员 ， 尤 其 是 学 生 ， 在 编写 程序 时 
遵循 前 两 个 设计 原则 。 首 先 ， 它 可 以 让 设计 者 知道 状态 在 何 处 。 当 显 式 声明 为 寄存 器 后 ， 其 他 
模块 推断 出 锁 存 器 可 以 视 作 出 错 ， 因 为 设计 者 知道 状态 的 位 置 。 如 果 采 用 了 图 A-2 中 的 风格 进 
行 编码 ， 很 容易 产生 未 知 状态 。 无 法 区 分 哪 一 个 是 状态 变量 ， 哪 一 个 是 计算 下 一 状态 的 中 间 
变量 。 

图 A-1 中 的 编码 风格 有 助 于 设计 师 了 解 自己 编写 的 Verilog 代码 综合 后 的 结果 。 这 种 风格 
编写 的 代码 最 后 会 生成 状态 寄存 器 和 产生 下 一 状态 的 组 合 逻 辑 。 如 果 采 用 图 A-2 中 这 种 将 状态 
和 功能 混在 一 起 的 风格 编码 ， 设 计 师 尤其 是 学 生 ,， 往往 习惯 按 C 语言 风格 编程 ， 这 样 就 无 法 了 
解 此 时 发 生 了 什么 以 及 此 处 执行 了 什么 。 而 这 产生 的 结果 往往 是 灾难 性 的 。 

我 们 推荐 的 这 种 编程 风格 可 以 避免 混淆 现 态 和 次 态 。 语 句 


wire[n-1:0] next = rst ? O : out+l ; 


清楚 地 表明 ，next 是 次 态 ， 这 里 正在 用 现 态 out 计算 次 态 F, 语句: 


out <= rst 2 0 : out+l ; 


在 赋值 语句 两 边 使 用 了 相同 的 变量 out ,混淆 了 这 个 问题 。 次 态 被 隐藏 了 。 

而 且 ， 我 们 推荐 的 编码 风格 中 使 用 的 是 阻塞 语句 “ = ”而 不 是 非 阻塞 语句 “ < =”， 这 可 
以 避免 出 现 很 多 问题 。 况 且 ， 图 A-2 中 的 编码 风格 没有 任何 明显 的 优势 。 与 好 的 编码 风格 相 
His EEA Wea SREP ac rer smo 

不 要 把 状态 和 功能 混在 一 个 always 语句 块 中 。 图 A-2 这 种 编码 风格 没有 任何 优势 ， 反 而 
是 相当 不 利 的 。 


A. 3 定义 组 合 模块 使 其 便于 阅读 
现在 ， 我 们 已 经 把 所 有 的 状态 显 式 声明 为 寄存 器 型 ， 下 面 可 以 专注 于 如 何 写 出 好 的 组 合 逻 
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辑 模块 了 。 
现代 逻辑 综合 工具 都 能 够 很 好 地 胜任 小 型 组 合 模块 的 优化 工作 。 因 此 ， 这 些 模块 应 该 按照 
容易 阅读 和 理解 的 方式 编写 。 对 于 容易 用 真 值 表 描述 reg[4:0] days ; 
的 逻辑 ， 我 们 使 用 一 个 case 或 casex 语句 对 模块 
进行 编码 。 对 于 容易 用 公式 描述 的 逻辑 (第 16 章 的 [always @(*) begin 





数据 通路 逻辑 ) ， 采 用 赋值 语句 较为 合适 。 ree e EET 


语句 实现 一 个 用 表 描 述 的 组 合 逻辑 功能 ， 该 功能 用 来 4,6,9,11: days = 5'd30 ; 
计算 一 个 月 有 几 天 。 输 出 days 声明 为 reg WS, 2: days = 5'd28 ; 

case 语句 对 输入 变量 month 进行 判断 ， 并 为 每 个 输 SEARE CAS S BIBAR p 
和 指定 一 个 适当 的 输出 值 。 默 认 的 输出 放 在 de- | “se 





end 
fault 下 处 理 。 输 出 相同 的 放 在 一 起 处 理 ， 这 样 代 
码 看 起 了 更 清晰 、 更 简洁 。 图 A-3 如 果 一 个 组 合 逻辑 适合 用 表 来 描 
容易 用 公式 描述 的 组 合 逻辑 应 该 使 用 赋值 语句 ， SEROUS See eT 


如 图 A-4 所 示 。 假 设 我 们 要 统计 一 个 5 位 信号 in 中 1 的 个 数 ” ， 此 时 用 公式 就 很 容易 理解 和 
描述 。 如 果 用 一 个 case 语句 来 描述 该 功能 ， 代 码 会 很 长 而 且 不 易 理 解 。 





|wire [2:0] number of ones = in[0]+in[1]+in[2]+in[3]+in[4] | 








图 A-4 如 果 一 个 组 合 逻 辑 适合 用 公式 来 描述 就 可 以 用 assign 语句 实现 


对 于 那些 根据 真 值 表 来 选择 公式 的 模块 ， 可 以 用 case 语句 来 描述 。 控 制 信号 的 真 值 表决 
定 下 一 个 状态 用 哪 一 个 公式 做 计算 。 这 种 编码 风格 见 图 A-5。 

当 一 组 具有 优先 级 的 二 进 制 控 制 信号 需要 译 码 来 确定 执行 的 功能 时 ， 将 这 些 信号 混合 起 用 
casex 语句 实现 ， 如 图 A-6 所 示 。 该 语句 根据 二 进 制 控制 信号 来 决定 下 一 状态 next 是 执行 重 
置 、 装 载 、 左 移 还 是 递增 。 























reg [7:0] next ; reg [7:0] next ; 
always @(*) begin always @(*) begin 
case (opcode) casex({rst, load, shl, inc}) 
‘ADD: next = acc + data Atbisxx: next = 8'bd r 
“XOR: next = acc ^ data ; 4*bOIxx: next = in ; 
‘AND: next = acc & data 4'b001x: next = state<<l ; 
‘OR: next = acc | data ; 4‘b0001: next = state+l ; 
default: next = 0; default: next = state ; 
endcase endcase 
end end 
图 A-5 利用 case 语句 对 控制 信 图 A-6 基于 4 个 优先 级 的 输入 信 
号 (本 例 中 为 opcode ) 号 , 采用 casex 语句 为 
译 码 ， 根据 译 码 结果 选择 next 赋值 
一 个 公式 进行 计算 


O 选择 reg 作为 关键 词 是 一 种 不 幸 。 这 导致 许多 学 生 以 为 声明 了 一 个 寄存 器 ， 其 实 并 非 如 此 。reg 只 是 声明 了 
一 个 在 always 语句 中 用 来 赋值 的 信号 。 

O 数字 系统 中 经 常 需要 统计 二 进 制 数 中 !1 的 个 数 。 有 些 计算 机 中 设 有 POPCOUNT 指令 ， 该 指令 就 是 用 来 执行 此 
功能 的 。 
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A. 4 所 有 分 支 上 的 变量 都 需 赋值 


为 了 避免 推断 出 锁 存 器 一 一 这 是 我 们 不 希望 出 现 的 状态 ， 要 在 条 件 语句 的 所 有 分 支 上 为 每 
个 变量 赋值 。 

图 A-7 给 出 了 一 个 常见 的 错误 例子 。 但 rst 为 真 时 ，next 信号 被 赋值 。 但 rst 为 假 时 ， 
next 信和 号 没有 赋值 。 这 不 是 一 个 组 合 电路 ， 而 是 一 个 锁 存 器 。 当 rst 为 假 时 ，next 信号 将 
保持 原 值 不 变 。 

图 A-8 描述 了 if 语句 的 正确 使 用 方式 。 无 论 rst 信和 号 为 真 或 假 ，next 信和 号 都 会 被 赋值 。 


reg [7:0] next ; 
reg [7:0] next ; 


always @(*) begin 
always @(*) begin 


if (rst == 1) next = 0; 
if(rst == 1) next = 0 ; else next = out+l ; 


end end 





图 A-7 糟糕 的 代码 : 由 于 rst AS 图 A-8 好 的 代码 : 所 有 分 支 中 next 
HF, next 没有 被 赋值 ， 会 推 都 被 赋值 
断 出 一 个 锁 存 器 


另 一 个 常见 的 导致 推断 出 锁 存 器 的 情况 是 在 case 
或 casex 语句 中 没有 默认 值 。 图 A-9 就 是 这 样 的 一 个 例 
子 。 该 代码 与 图 A-6 基本 相同 ， 只 是 省 略 了 default, always @(*) begin 
其 结果 是 推断 出 一 个 锁 存 器 ， 且 当 所 有 控制 信号 输入 为 casex({rst, load, shl, inc}) 





reg [7:0] next ; 


0, next 信和 号 没有 赋值 。 4’blxxx: next = iba ; 
case 语句 或 casex 语句 中 对 于 没有 明确 处 理 的 情 A eS a E 
h 4'b001x: next = state<<l ; 


case 语句 都 可 以 使 用 的 情况 下 ， 优先 选择 case 语句 。 endcase 
另 一 个 常见 的 错误 是 在 某 些 分 支 中 未 对 所 有 变量 赋 Lend 
值 。 图 A-10 中 所 示 就 是 这 样 的 错误 。out 信号 在 第 二 图 .9 MENRE.: case 语句 中 没 
个 分 支 中 没有 赋值 。 因 此 将 推断 出 一 个 锁 存 器 ， 该 锁 存 ain 
器 将 保持 原 值 。 








reg [n-1:0] next_state ; 
reg [m-1:0] out ; 


always @(*) begin 
case({in,state}) 
{2'bxx, ‘FETCH STATE}: begin 





out = ‘FETCH OUT ; 
next_state = ‘DECODE STATE ; 
end 
{2'bix, ‘DECODE_STATE}: begin 
next_state = ‘REG READ STATE ; 
end 





{2'b0x, ‘DECODE_STATE}: begin 
图 A-10 糟糕 的 代码 : 某 些 分 支 中 未 对 所 有 变量 赋值 
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out = ‘DECODE_ZERO ; 
next_state = ‘REG READ STATE ; 
end 


// 此 处 为 了 简洁 ， 其 余 情 况 略 去 


default: begin 
out = {m{x}} ; 
next state = {n{x}} ; 
end 


endcase 





end 


图 A-10 (#) 


为 了 避免 这 种 麻烦 ， 可 以 将 所 有 待 赋值 的 变量 串 接 起 来 ， 在 每 个 分 支 中 使 用 一 个 赋值 语 
句 ， 如 图 A-11 所 示 。 只 要 我 们 采用 了 这 种 编码 风格 ， 在 任何 分 支 内 都 很 难忘 记 去 给 变量 赋值 ; 


而 且 ， 它 还 可 以 使 代码 更 容易 阅读 。 这 种 编码 风格 看 起 来 就 像 一 个 状态 表 。 


[reg [n-1:0] next state ; 

















reg [m-1:0] out ; 


always @(*) begin 
case({in,state}) 
{2'bxx, ‘FETCH_STATE}: 


(out, next_state} = {‘FETCH_OUT, ‘DECODE_STATE} ; 
2'b1x, ‘DECODE_STATE}: 

b1 CODE_STAT 

{out, next_state} = {‘RR_OUT, ‘REG_READ STATE} ; 
2'bOx, ‘DECODE_STATE} : 

b — 

(out, next _state} = {‘DECODE_ZERO, ‘REG_READ STATE} ; 


// 此 处 为 了 简洁 ， 其 余 情况 略 去 
default: {out, next_state} = {n+m{x}} ; 


endcase 





end 
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图 A-11 好 的 代码 : 采用 串 接 方式 赋值 ， 在 各 个 分 支 中 就 不 会 遗漏 变量 ， 而 且 代 码 可 读 性 好 


A.5 保持 小 的 模块 代码 


行为 模块 的 代码 应 尽 可 能 小 ， 这 不 仅 有 利于 阅读 还 能 确保 知晓 模块 综合 的 结果 。 代 码 行 数 
最 好 不 超过 50 行 ， 这 样 文本 编辑 器 上 的 代码 一 屏 就 能 显示 出 来 ， 便 于 一 眼 可 以 看 到 整个 模块 
和 理解 模块 的 功能 。 而 且 ，50 行文 字 足 以 描述 大 部 分 组 合 逻 辑 ; 50 行 以 上 的 代码 通常 包含 几 
个 独立 的 功能 ， 应 该 将 其 分 解 。 如 果 确 实 有 单一 功能 无 法 用 50 行 代码 描述 时 ， 应 该 认真 思考 


是 否 可 以 降低 它 的 复杂 性 。 
A.6 大 模块 应 该 是 结构 化 的 


大 的 模块 应 该 采用 结构 化 建 模 ， 模 块 实例 化 后 通过 导线 连接 。 结 构 化 模块 的 综合 结果 是 清 
晰 的 。 此 外 ， 现 代 逻 辑 综合 工具 在 处 理 小 型 组 合 逻 辑 模块 和 算术 电路 方面 已 做 得 很 好 ， 但 对 于 
大 模块 的 处 理 还 有 待 于 加 强 。 这 些 工具 擅长 做 小 规模 的 优化 ， 却 无 法 纵览 全 局 ， 不 懂得 如 何 进 


行 大 规模 的 优化 。 图 16-6 中 共用 加 法 器 的 方式 就 是 采用 了 结构 化 的 建 模 。 


1 
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A.7 使 用 描述 性 的 信和 号 名 
如 果 信 号 名 中 包含 了 对 功能 的 描述 ， 那 么 代码 的 可 读 性 就 会 很 好 。 例 如 ， 语 名 


assign aligned mantissa = mantissa << exponent_difference ; 


阅读 该 语句 时 ， 我 们 发 现 每 个 信号 的 含义 及 该 语句 的 功能 很 明确 。 相 反 ， 如 果 同 样 的 功能 ， 
写成 


assign i = j << K ; 


就 没有 传达 出 信号 的 含义 和 语句 的 意图 。 

但 是 , 长 的 名 字 有 利 有 次。 虽然 可 读 性 好 ， 但 代码 看 起 来 凌乱 。 如 果 语 句 正好 为 一 行 ( 或 
几 行 )， 这 些 语句 容易 理解 。 长 的 名 字 往 往 会 使 语句 超出 一 行 甚至 多 行 ， 变 得 难以 阅读 。 将 信 
号 和 有 注释 含义 的 单词 结合 起 来 用 缩写 形成 短 的 信号 名 有 助 于 阅读 ， 如 下 所 示 。 


assign a m= m << ed ; 


当 无 法 决定 使 用 全 名 还 是 缩写 时 ， 可 以 先 用 两 种 方法 分 别 编写 代码 ， 然 后 从 中 选择 一 个 最 
容易 阅读 的 版 本 。 


A. 8 用 符号 表示 信号 的 子 字段 

长 信号 经 常 被 分 成 若干 子 字段 。 例 如 ， 一 个 32 位 长 的 指令 可 以 被 分 为 一 个 8 位 的 操作 码 、 
三 个 5 位 的 寄存 器 说 明 符 和 一 个 9 位 的 常数 。 用 符号 表示 信号 的 子 字段 ， 代 码 的 可 读 性 会 更 
好 。 思 考 下 面 的 语句 


case (instruction [31:24]) ... 


这 种 表示 方式 传达 出 的 含义 不 清楚 ， 且 容易 出 现 标 错位 字段 的 问题 ， 尤 其 当 位 字段 改变 时 
更 容易 出 错 。 将 语句 写成 


case(opcode) ... 


可 读 性 会 更 好 。 

可 以 将 长 信号 分 割 后 串 接 起 来 放 在 赋值 语句 的 左边 。 例 如 ， 图 A-12 中 的 信号 instruc- 
tion 是 一 条 MIPS 指令 ， 它 被 分 成 若干 个 字段 并 组 成 三 种 不 同 的 指令 格式 。 信 号 opcode 被 
赋值 3 K, rega 和 regb 被 赋值 两 次 。 但 是 这 不 会 出 现任 何 问题 ， 因 为 这 些 赋值 是 相 容 的 。 





wire [5:0] opcode, fun ; 

wire [4:0] rega, regb, regc, sa ; 
wire [15:0] immediate ; 

wire [25:0] jump_target ; 


assign {opcode, rega, regb, regc, sa, fun} = instruction ; 


assign {opcode, rega, regb, immediate} = instruction ; 
assign {opcode, jump target} = instruction ; 


图 A-12 将 一 个 长 信号 拆 成 几 个 子 信号 并 串 接 起 来 放 在 赋值 语句 的 左 侧 。 当 该 信号 包含 
多 种 解释 时 ， 可 以 使 用 多 个 赋值 语句 


将 信号 分 开 串 接 后 再 赋值 的 方式 ， 比 图 A-13 中 采用 的 对 每 个 子 信号 单独 赋值 的 方式 要 好 。 
单独 赋值 的 可 读 性 差 。 串 接 在 一 起 可 以 看 到 相关 的 字段 ， 一 目 了 然 ， 而 分 开 赋值 就 不 明显 。 此 
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外 ， 分 开 赋 值 要 求 对 每 个 字段 的 位 数 标注 两 次 。 每 个 信号 的 宽度 要 声明 一 次 (例如 ，wire 
[5 :0]opcode)。 长 信号 中 哪些 位 会 被 用 到 还 必须 明确 指定 ， 例 如 instruction[31:26]。 
而 采用 信号 串 接 方式 ， 不 需要 这 个 声明 。 因 此 简化 了 代码 , 减少 了 下 标 标 错 的 概率 ， 使 代码 更 
易于 维护 。 





[Ss 
wire [4:0] rega = instruction[25:21] ; 













0] opcode = instruction[31:26] ; 








wire [4:0] regb = instruction[20:16] ; 

wire [4:0] regc = instruction[15:11] ; 

wire [4:0] sa = instruction[10:6] ; 

wire [5:0] fun = instruction[5:0] ; 

wire [15:0] immediate = instruction[15:0] ; 
[25:0] jump_target = instruction[25:0] ; 





图 A-13 糟糕 的 代码 : 将 一 个 信号 按 字段 分 成 若干 个 独立 的 赋值 语句 ， 这 种 方式 可 读 性 差 ， 
而 且 更 容易 标 错 下 标 


A.9 定义 常量 


数字 在 Verilog 代码 中 应 该 少 出 现 ， 而 且 任 何 给 定 的 数 不 能 多 次 出 现 。 定 义 一 个 常量 或 参 
数 ， 然 后 用 符号 名 代替 数字 可 以 增加 代码 的 可 读 性 和 可 维护 性 。 

分 析 一 下 图 A-14 中 MIPS 处 理 器 指令 译 码 器 生成 的 代 [ear ‘ieee baal 
码 片 段 。 读 完 这 段 代码 后 ， 我 们 发 现 无 法 理解 它 的 功能 。 {6'h0,6'h20}: aluop = 3'h5 ; 
mE., MIPS R 型 指令 操作 码 6 ' hn0 和 运算 器 的 “+” 操 {6'h0,6’h21}: aluop = 3'h6 ; 
作 (3'h5) 出 现 了 两 次 。 如 果 将 其 定义 为 常量 ， 代 码 的 ve 
可 读 性 会 更 好 。 {6'h23,6’hxx}: aluop = 3’h5 ; 

如 图 A-15 所 示 ， 用 符号 常量 替换 数字 ， 代 码 功 能 变 
得 清晰 。 而 且 用 符号 常量 表示 的 值 还 能 被 重复 使 用 ， 就 像 
R 型 指令 的 操作 码 用 ' RTYPE_OPcC，ALU 的 + 操作 码 用 ”国人 14 精 糕 的 代码 常量 应 该 用 
'ADD_OP 表 示 一 样 ， 实 际 数字 只 在 定义 时 使 用 一 次 。 这 EREA 
样 对 数值 进行 修改 变 得 很 容易 。 例 如 ， 如 果 我 们 要 重新 设计 ALU, 将 + 的 操作 码 从 5 修改 为 
7， 只 需要 在 定义 语句 处 修改 就 可 以 了 。 修 改 后 的 值 将 传 到 所 有 使 用 该 常量 的 地 方 。 





endcase 





casex ({opcode, fun}) 
{‘RTYPE_OPC, ‘ADD FUN}: aluop = ‘ADD_OP ; 
{ ‘RTYPE OPC, ‘SUB FUN}: aluop = ‘SUB_OP ; 


['LW_OPC,6'hxx): aluop = ‘ADD OP ; 





endcase 


图 A-15 好 的 代码 : 用 符号 名 代替 常量 。 数 值 常 量 只 需要 定义 一 次 ， 就 可 以 多 次 使 用 


符号 名 要 么 作为 常数 (使 用 Verilog H ' define 语句 ) 要 么 作为 参数 (HAI parameter 
语句 ) 。 如 果 在 模块 的 不 同 实例 化 中 取 相 同 的 值 ， 符 号 名 应 作为 常数 。 如 果 在 模块 的 不 同 实例 
化 中 取 不 同 的 值 ， 符 号 名 应 作为 参数 。 例 如 ， 寄 存 器 或 计数 器 的 位 宽 可 以 作为 参数 使 用 。 处 理 
k 器 的 操作 码 和 ALU 的 功能 码 可 以 作为 常数 ， 因 为 在 不 同 的 模块 实例 中 是 固定 不 变 的 。 
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A. 10 ”注释 的 目的 是 描述 意图 及 阐明 设计 理由 ,很 直观 的 代码 不 需要 
说 明 
好 的 代码 应 该 有 大 量 高 质量 的 注释 。 好 的 注释 不 仅 可 以 告诉 我 们 代码 的 功能 ， 明 白 设计 者 
的 意图 ， 还 可 以 给 出 如 此 设计 的 理由 。 遗 憾 的 是 ,许多 设计 师 撰写 注释 时 只 重 数量 不 重 质量 ， 
尽管 添加 了 许多 注释 但 不 能 提供 任何 有 用 的 信息 。 
我 们 看 下 面 的 代码 : 


case (aluop) 
‘ADD OP: c=a+b; // anb 


endcase 
后 面 的 注释 是 一 句 废话 ! 很 显然 这 个 语句 的 功能 就 是 a 加 b。 这 个 注释 使 代码 变 得 凌乱 ， 应 该 
删 掉 。 

现在 我 们 看 看 下 面 的 注释 ， 这 段 注释 应 该 添加 到 图 16-7 的 代码 中 : 

// 将 加 法 器 /减法 器 从 case 语 名 中 分 离 出 来 

// 因为 这 样 做 综合 器 就 不 会 生成 两 个 加 法 器 


// daown=0 时 加 ，down=1 时 减 
assign outpml = out + {{n-1{down}},1’b1} ; 


虽然 这 段 注 释 看 起 来 元 长 ， 但 却 非常 有 价值 。 它 让 我 们 从 总 体 上 认识 了 这 段 代码 : 该 加 法 器 是 
从 一 个 case 语句 中 分 离 出 来 的 。 这 样 做 的 理由 是 ， 如 果 我 们 不 手动 分 离 ， 综 合 器 会 生成 两 个 
加 法 器 。 此 外 它 还 解释 了 代码 中 的 一 些 功能 ， 而 这 并 不 是 一 眼 就 能 看 出 来 的 。 


A. 11 永远 不 要 忘记 你 在 定义 硬件 


当 我 们 编写 Verilog 代码 时 ,很 容易 陷入 计算 机 程序 的 编程 思维 ,而 计算 机 程序 在 同一 时 
间 只 能 执行 一 条 语句 。 毕 竟 ，Verilog 看 起 来 很 像 C 代码 ， 而 且 它 们 有 许多 共同 的 结构 。 尤 其 是 
当 程序 员 经 常 在 Verilog、C、Python 或 其 他 一 些 编程 语言 之 间 切 换 时 ， 更 容易 掉 进 这 个 陷阱 ， 
而 这 是 非常 危险 的 。 

与 计算 机 编程 语言 不 同 ， 如 C， 同 一 时 间 只 有 一 条 语句 执行 。 而 在 Verilog 中 所 有 语句 同时 
执行 的 。 编 写 Verilog 程序 时 其 实 是 在 定义 硬件 ， 所 有 这 些 硬 件 是 并 行 工作 的 。 每 个 模块 中 所 
有 的 assign 语句 是 同时 执行 的 。 

永远 不 要 忘记 你 定义 的 是 硬件 ， 所 有 的 事情 都 是 同时 发 生 的 。 


A. 12 阅读 代码 并 挑刺 


如 果 你 想 成 为 一 个 优秀 的 作家 ， 可 以 阅读 别人 的 作品 ， 给 他 们 的 写作 挑刺 ， 并 效仿 好 的 写 
作 手 法 。 同 样 ， 你 也 可 以 成 为 一 个 优秀 的 Verilog 设计 者 。 只 要 有 机 会 就 阅读 Verilog 代码 ， 对 
代码 挑刺 ， 指 出 自己 和 别人 编写 的 代码 有 哪些 优点 、 有 哪些 不 足 。 做 到 这 一 点 一 定 要 客观 。 对 
于 好 的 东西 ， 采 取 拿 来 主义 ， 这 样 你 编写 的 代码 才能 更 优秀 、 更 具 可 读 性 或 者 更 容易 维护 。 当 
别人 对 你 的 代码 挑刺 时 ， 不 要 回避 。 要 愿意 接受 别人 的 批评 、 倾 听 别 人 的 意见 并 认真 学 习 。 

好 的 科技 公司 会 培养 工程 文化 ， 鼓 励 设 计 人 员 阅 读 和 批评 彼此 的 代码 。 许 多 公司 对 设计 进 
行 评审 并 形成 制度 化 ， 设 计 评 审 由 团队 内 的 顶尖 工程 师 来 完成 。 再 就 是 采用 结对 编程 方式 ， 所 
有 代码 以 两 人 为 一 组 进行 编写 ， 其 中 一 个 编程 ， 另 一 个 人 挑 毛病 。 成 功 的 编码 ， 最 重要 的 是 建 
立 一 种 文化 ， 即 设计 人 员 审 查 别 人 的 代码 ， 提 出 有 益 的 批评 ， 并 公开 别人 对 自己 代码 的 批评 。 
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CAM (CAM), 525 
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dynamic (动态 的 ) 121 

static-0 (静态 -0) 121 

static-1 (静态 -1) 121 
head-of-line blocking ( 队 首 ) , 522 
hexadecimal, base-16 (十 六 进 制 ， 基 数 16) , 208 
high impedance (高 阻 态 ) , 72 
hold time (保持 时 间 ) 

calculating (计算 ) , 550, 553 

flip-flop 〈 触 发 器 ) , 318 

latch ( 锁 存 器 ) 548, 554 

SRAM, 516 
hold-time violations (违反 保持 时 间 规 则 ), 318 
homing sequence ( 归 位 序列 ), 310 
Huffman decoder ( 赫 夫 曼 译 码 器 ) , 427 
Huffman encoder ( 赫 夫 曼 编码 器 ) , 423 

I 

idempotence property ( 同一 律 性 质 ) , 42 
identity axiom ( 自 等 律 公理 ) , 42 
idioms of digital design (数字 设计 术语 ) , 183 
illegal state (非法 状态 ) ,563 

probability of entry (进入 的 概率 ), 567 
implementation coverage ( 执行 覆盖 率 ) , 436 
implicant of a logic function ( 238 pK AA AIM) , 108 
implied 1 ( 隐 含 的 1), 244, 253 
instantiation, module ( 实例， 模块 ), 129 
instruction types (指令 类 型 ) , 397 

branch (分 支 ), 390 

store (存储 ), 397 
intellectual property (知识 产权 ), 182 
interconnect ( 互 连 ), 504 

bus (总 线 ) J bus 
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crossbar (交叉 和 开关) ， 见 crossbar 
networks (了 网络) , 510 
interface (接口 ) 
always valid ( 常 有 效 ) 461 
isochronous (同步 ) , 468 
packetized (分 包 ) , 465 
partitioning (划分 ) , 465 
periodically valid (周期 性 有 效 ) , 462 
pull timing ( 拉 时 序 ), 463 
push timing ( 推 时 序 ), 463 
ready - valid (就 绪 - 有 效 ), 463 
serial ( 串 行 的 ) , 465 
static (静态 的 ) , 462 
inversion bubble ( 反 相 圈 ) , 48 
inverter ( 反 相 器 ) , 3. NOT 
iterative circuit (和 迭代 电路 ) ，166 
J 
JTAG, 441 
K 


Karnaugh map ( 卡 诺 图 ), 112 
asynchronous (异步 的 ), 537 
L 


latch ( 锁 存 器 ), 548 
derivation (推理 ), 555 
tri-state ( =Z&) , 553 
latency (等 待 时 间 ) , 480 
length, gate (KE, HH), 60 
light flasher ( 闪光 信号 灯 ), 360 
load balance (负载 均衡 ), 494 
locality (局 部 性 ), 525 
logic diagram (WHEE), 47 
logic representations (i248 727. ) 
cube (立方 体 ) , 108 
incomplete (不 完全 ) , 116 
Karnaugh map ( 卡 诺 图 ) 112 
normal form (标准 形式 ), 45, 107 
sum of products ( 积 之 和 ) , 45 
logical effort (逻辑 功效 ) , 84 
look-ahead (超前 ) , 166, 255 
LSB, 208 ` 
M 


magnitude comparator (数值 比较 器 ) , 171 
look-ahead (超前 ) , 257 

majority function ( 择 多 函数 ) , 44 
CMOS gate (CMOS 门 电 路 ) , 70 





schematic (原理 图 ), 47 
switch network (开关 网 络 ), 57 
Verilog, 50 
mantissa (尾数 ), 243 
master FSM ( 主 FSM), 361 
master-slave FSMs ( 主 - 从 FSM) , 371 
master-slave partitioning ( 主 -从 划分 ) , 456 
maxterm ( 最 大 项 ) , 118 
Mealy state machine (米利 型 状态 机 ) , 297 
memory (存储 器 ) 
bank conflicts (存储 体 冲 突 ) , 523 
banked (存储 体 ), 519 
bit-sliced (位 片 ), 519 
hierarchy (层次 ), 524 
interleaved (交叉 的 ), 521 
primitive (基本 存储 体 ), 515 
metastability ( 亚 稳 态 ), 564 
convergence (收敛 ) 566 
demonstration ( 演示 ) , 570 
microcoded FSM ( 微 编码 FSM) , 383 
microinstruction (#454) , 385 


minimum cycle time (最 小 时 钟 周 期 时 间 ) , 318 


minterm (最 小 项 ), 46, 107 


model-view-controller partitioning ( 模型 -视图 -控制 器 


(MVC) 方式 划分 系统 ), 456 
module (模块 ), 50, 129 
monotonic functions ( #4 p§B) , 66 
Moore state machine (摩尔 状态 机 ) , 297 
Moore’s law (摩尔 定律 ) 33 
MOS transistor (MOS 唱 体 管 ) 
current (电流 ) 62 
electrical model (电路 模型 ) ，62 
operation (操作 ) , 61 
speed (IJE), 64 
switch model (开关 模型 ) 59 
MSB (最 高 有 效 位 ), 208 
multicast, bus (多 播 ， 总 线 ) , 507 
multiple-of-3 circuit (3 的 倍数 电路 ) ，187 
multiplexer (多 路 选择 器 ) , 155 
binary-select ( 选择 端 为 二 进 制 编码 ) , 158 


function implementation with (功能 实现 ) , 161 


SRAM, column (SRAM, 列 ), 516 

tri-state (三 态 ), 73, 156 
multiplication (乘法 ), 223 

Booth recoding ( 布 斯 编码 ), 260 

complex numbers (复数 ), 275 
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fixed-point (定点 数 ), 242 

floating-point (学 点 数 ), 245 

Wallace tree (〈 华 莱 士 树 ) 265 
music player (音乐 播放 器 ) 

partitioning ( 划分) , 457 

specification (规格 ) , 454 

timing ( BFF) , 473 

N 


NAND (与 非 ), 48 
CMOS gate (CMOS 门 ), 67 
logical effort ( 逻辑 功效 ) , 85 
schematic (原理 图 ), 48 
sizing (大 小 ), 84 
negation axiom ( 取 反 公理 ), 42 
nested timing ( 两 级 时 序 ), 466 
NFET, 61 
noise (噪声 ) ,5 
accumulation ( RR), 6 
analog (模拟 ) , 6 
restoration (恢复 ) ,6 
noise margin ( 噪声 容 限 ), 7 
NOR (或 非 ), 48 
CMOS gate (CMOS 门 ) , 67 
logical effort (逻辑 功效 ) , 85 
schematic (原理 图 ) , 48 
sizing (大 小 ), 85 
normal form (标准 形式 ) ， 见 logic representations 
normalization (规格 化 ), 243 
NOT ( 非 ), 41 
CMOS gate (CMOS 门 ), 67 
delay (延迟 ), 79 
energy (REFE), 96 
power (功率 ), 96 
schematic (原理 图 ), 47 
sizing (尺寸 ), 81 
transfer curve (传递 曲线 ), 64 
Verilog, 50 
o 


1s complement (1 的 补 码 ) , 216 
one-hot code ( 独 热 码 ) , 150 
one-hot decoder 〈 独 热 码 译 码 器 ) ，150 
opcode (操作 码 ) , 394 
OR (或 ), 41 

schematic (原理 图 ) , 47 

switch circuit (开关 电路 ) , 56 


Verilog, 50 
oscillation, asynchronous (振荡 FAR) , 534 
overflow (jt), 216 
2’s complement (2 的 补 码 ) , 219, 220 
P 


packet (数据 包 ) , 504 
packetization ( 分 包 ) , 466 
parasitic capacitance (寄生 电容 ) , 90 
partial product (部 分 积 ), 223 
partitioning ( 分区， 划分) 
control and data (控制 和 数据 ) , 342 
system (系统 ) , 456 
pass/fail simulation (仿真 通过 /失败 ), 139 
patch, microcode (修补 ， 微 码 ) ,383 
perfect induction (完全 归纳 法 ) , 43 
PFET, 61 
pipeline (流水 线 ) , 371, 479 
adder (加 法 器 ) , 484 
double-buffered ( 双 缓 冲 ), 489 
examples (实例 ), 482 
FIFO buffering (FIFO 缓冲 ), 494 
stalls (停顿 ) ，488 
pipeline partitioning (流水 线 划分 ) , 456 
PLA (programmable logic array) (可 编程 逻辑 阵 
列 ) ，180 
Pong 
partitioning (划分 ) , 456 
specification (规格 ) , 451 
timing (时 序 ), 471 
port, SRAM (端口 , SRAM), 516 
power (功率 ) 
dynamic (动态 ), 96 
sealing (缩放 比例 ), 97 
static (静态 ), 97 
power gating (电源 门 控 ), 97 
precision, numerical ( 精度， 数字 的 ), 237 
predecoder ( 预 译 码 器 ) , 152 
primeimplicant ( 质 蕴 涵 项 ), 110 
essential (必要 ), 110 
priority arbiter (优先 级 仲裁 器 ) , 192 
priority encoder (优先 编码 器 ) , 167 
processor ( 处 理 器 ) , 15, 403 
product implementation plan (产品 实施 计划 ) , 25 
product-of-sums implementation ( 和 之 积 形式 的 实 
现 ), 118 
program counter (程序 计数 器 ) , 389 
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PROM, 176 calculating (计算 ) , 550, 552 
propagate signal (传递 信号 ) , 212 flip-flop (触发 器 ) , 317 

look-ahead (超前 ), 255 latch ( 锁 存 器 ) , 548, 554 
propagation delay (传播 延迟 ) , 314 SRAM, 516 

SRAM, 516 setup-time violations (建立 时 间 违 规 ), 318 
pulldown network (下 拉 网 络 ) 67 seven-segment decoder (七 段 译 码 器 ) , 124, 141 
pullup network (上 拉 网 络 ), 67 inverse ( PAX), 143 

Q shift register ( 移 位 寄存 器 ) , 338 


shifters ( 移 位 器 ) ，173 

shmoo plot (shmoo 图 ), 443 

sign extension (符号 扩展 ), 221 

race, asynchronous ( 竞争， 异步), 534, 540 sign-magnitude numibers (符号 -数值 码 ) , 216 
critical (临界 ), 540 signaling (信和 令 ) 

RAM (random access memory ) (随机 存 取 存储 analog (模拟 ) , 5 


quantized representation ( 量化 表示 ) , 10 
R 


器 ) ，177 binary ( 二进制) , 4 

random test ( 随机 测试 ) , 437 multi-bit (多 位 ), 9 

range (范围 signed numbers ( 带 符号 数 ), 216 
gi (定点 ) , 239 simulation, Verilog (仿真 ，Verilog) , 32, 137 
frisst paint ( 浮 点 ), 244 sizing, logic gates (RF, #2#88[]), 84 

hayata: (缩减 ) 164 skew, clock (偏差 ， 时 钟 ) ,321 

register (寄存 器 ) , 300 slack, timing (松弛 ， 时 序 ), 320 

regression testing ( 回归 测试 ), 26 software (软件), 15, 405 

relative error ( 相对 误差 ), 237 SOS detection FSM (SOS 探测 的 FSM) , 415 

repeater ( 中 继 器 ) , 93 source (Ji), 61 

representation function (表示 函数 ) ,236 spatial locality (空间 局 部 性 ) , 525 

resistance, source (电阻 ， 源 极 ) ，62 specification (设计 规格 ) , 22 

resolution (分 辨 率 ), 237 system ( 系统 ), 450 
tenet paint (定点 ) 239 specification coverage (需求 覆盖 率 ) , 435 
floating-point ( 浮 点 ), 243 speculation ( 先行 预测 ) , 473 

resource partitioning ( 资源 划分 ), 456 SRAM, 515 

risks (风险 ) , 24 timing (时 序 ), 516 

ROM (read-only memory) (只 读 存 储 器 ) ,173 stable state (稳定 状态 ) , 534 


function implementation with (功能 实现 ) , 174 


stall (停顿 ) JI pipeline 
rounding (A ) , 237 


standard cell (标准 单元 ) , 27 


router ( 路由器) , 510 state (状态 ) , 292 
S state assignment ( 状态 分 配 ) , 299 

scaled numbers ( 按 比 例 缩放 数字 ) , 240 binary (二 进 制 ) , 299 
scaling, transistor ( 规模， 晶体 管 ) , 33 one-hot ( 独 热 码 ) 299 
sean chain (扫描 链 ) , 441 state diagram (状态 图 ) , 295 
SDDR3, 519 state equivalence ( 状态 等 价 ) , 556 
sequencer, microcode (序列 发 生 器 ， 微 码 ) , 387 state register ( 状态 寄存 器 ) , 300 
sequential circuits ( 时序 电路 ) , 291 state table (状态 表 ) , 295 

asynchronous (5:4) , 533 straw man specification ( 假想 对 象 的 设计 规格 ) , 22 

synchronous (同步 ) , 293 structural Verilog (结构 化 ) Verilog, 130 
serialization ( 434744) , 465 stuck-at fault (固定 故障 ) , 439 


setup time (建立 时 间 ) subroutines ( 子 程序 ), 400 





subtractor (减法 器 ) , 220 
sum of products ( 积 之 和 ) , JL logic representations 
switch circuit (开关 电路 ) , 55 
symmetric functions ( XERA) , 70 
synchronization failure (同步 失败 ) , 563 
synchronizer (同步 器 ) , 576 

brute-force (XH ) , 577 

FIFO, 581 

sequence (序列 ) 577 

state (状态 ) , 577 
synthesis, Verilog (434, Verilog), 14, 130 
system specification ( 系统 设计 规格 ), 450 
system timing ( 系统 时 序 ), 461 

T 


temporal locality (时 间 局 部 性 ), 525 

test patterns (测试 模式 ) , 138 

test plan (测试 计划 ) , 26 

test suite (测试 用 例 集 ) , 435 

test vector (测试 向 量 ) , 439 

testbench (测试 平台 ) ，137 

thermometer encoding ( 温度计 编 码 ) ， 见 encoding 

throughput (吞吐 率 ), 479 

tic-tac-toe ( 井 字 棋 游 戏 ) ，193 
sequential (时 序 ), 422 

timer (定时 器 ), 336 

timing, interface ( 时序， 接口 ), 461, 
terface 

timing analysis tools (时 序 分析 工具 ) , 324 

timing diagram (时 序 图 ), 292 

timing table (时 序 表 ), 469 

toggle circuit ( 触发 电路 ) , 536 

tomorrow circuit (明天 电路 ) , 189 

topology, interconnect (拓扑 ， 互 连 ), 510 

total path effort ( 总 路 径 功效 ) , 89 

tournament arbiter ( 淘汰赛 仲 裁 器 ) , 192 

traffic-light controller ( 交通 灯 控 制 器 ) 
factored (分 解 ) , 367 
unfactored (未 分 解 ) , 296 

trajectory map (轨迹 图 ) , 537 

transfer curve, de (传递 曲线 ，dc) , 7 

transient state (MEAS) , 534, 537 

transistor ( 晶体 管 ) JL MOS transistor 

tri-state circuits (三 态 电路 ) ,72 

truncation (截断 ) , 237 

truth table ( 真 值 表 ), 41, 105 

2’s complement (2 的 补 码 ), 217 
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unit test (单元 测试 ) ，26 
unsigned numbers (无 符号 数 ) , 216 
Vv 


Vos 


4 
V,,4 
Vino 4 

4 


NMH + 7 
NML » 7 


V 
Ke. 
K> 
V 
V 
Vou 


a 4 
value function ( 取 值 函数 ) , 236 
vending machine FSM ( 自动 售 货 机 FSM) , 342 
verification (验证 ) , 26, 435 
Verilog, 14 
Boolean expressions (布尔 表达 式 ) , 49 
Verilog keywords ( Verilog 关键 字 ) 
(AEF), 170 
1 = = (A), 139 
< < (Æ), 152 
= = (相等 ), 170 
= = = (全 等 ), 139 
> > (AB), 152 
?: (RAF), 191 
[x:¥], 129 
名 (Ë), 189 
| (规约 或 )，164 
| (sk), 50 
& (规约 与 ) 164 
& (+j), 50 
+ (jm), 215 
- (IR), 220 
^ (R), 50 
~^ (FFE), 17 
lk {x} (复制 ) ，157 


Ix, y} (拼接 ), 144 
# (HERF), 50, 137 
~ (E), 50 


always @ , 130 

always @ (posedge) , 305 
always @ (*), 130 
and, 135 
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assign, 50, 133 xor, 135 
case, 130 z, 73 
casex, 132 virtual channels ( 虚拟 通路 ) 512 
define, 141 w 
14 
endmodule, 14, 129 Wallace tree ( 华 莱 士 树 ), 265 


initial, 50, 137 
input, 14, 129 
instantiation (实例 ), 131 


weighted number representation ( 加权 数 表示 ) , 207 
width, gate (宽度, 门 ), 60 
wires ( 连 线 ) , 92 


, 14, f 
module 129 wtite buffer CEARR) $27 
nand, 135 Ñ 

input (输入 ), 108 
nor, 135 

output (输出 ) 116 
numbers ( 数字 ) , 142 
or, 135 x 
output, 14, 129 XNOR, 170 

XOR, 47 


parameter, 151 
reg, 130 
repeat, 137 


CMOS gate (CMOS [ J) , 71 
schematic (原理 图 ), 47 
signed, 275 switch circuit (开关 电路 ) ,58 
wire, 14, 130 Z 

x, 132 z state (z A), 73 


xnor, 135 
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Digital Design A Systems Approach 


Dally 和 Harting 基 于 他 们 在 数字 设计 领域 的 特殊 经 验 ， 以 一 种 清晰 和 建设 性 的 方式 结合 了 数字 电路 和 体系 结构 设 
it. 通过 本 书 接触 计 算 系 统 的 不 同 抽象 层次 和 视角 ， 学 生 将 发 现 一 种 现代 和 高 效 的 方式 来 理解 数字 设计 消 后 的 基础 
知识 和 技术 

一 一 Giovanni De Micheli， 瑞 士 联邦 理工 学 院 


所 有 你 期 望 了 解 的 数字 设计 的 知识 都 可 以 从 这 本 Dally 教 授 的 书 中 学 到 。 作 者 基于 几 十 年 的 实践 经 验 ， 提炼 出 设 
计 和 组 成 完整 数字 系统 所 必需 的 方法 和 技术 。 本 书 条 理 清 晰 、 叙 述 简洁 ， 很 好 地 履 盖 了 数字 设计 的 基础 知识 和 系统 
层面 的 技术 .学 习 本 书 是 将 来 有 志 成 为 微 处 理 器 和 SoC 设 计 师 的 学 生 的 一 个 理想 起 点 1 
一 一 Robert Mullins， 剑 桥 大 学 和 树 莓 派 基 金 会 
这 本 书 设立 了 本 科 讲 授 数 字 系统 设计 的 新 标准 . 书 中 实用 的 方法 和 具体 的 实例 为 任何 想 要 理解 和 设计 现代 复杂 
eevee TTT 


— Steve Keckler， 得 克 萨 斯 大 学 奥斯汀 分 校 


这 本 书 不 仅 讲 如 何 做 数字 设计 ， 而且 更 重要 的 是 ， 它 展示 了 如 何 做 好 的 数字 设计 。 本 书 强 调 尽 量 采 用 简洁 接口 
进行 模块 化 的 重要 性 ， 生 成 不 仅 满足 规范 而 且 可 以 容易 被 其 他 人 理解 的 数字 工件 的 重要 性 - 本 书 将 不 仅 对 于 学 生 非 
常 有 用 ， 而 且 对 于 该 领域 的 实践 者 同样 是 一 本 非常 有 价值 的 参考 书 | 

— Chuck Thacker， 微 软 公司 


,EE 
从 基础 到 系统 ， 采 用 硬件 描述 语言 HDL ( Verilog) 使 得 书 中 内 容 更 加 实用 和 符合 工业 界 需 求 


一 一 Rob A. Rutenbar， 伊 利 诺 伊 大 学 厄 巴 纳 -香槟 分 校 


本 书 从 系统 的 视角 介绍 了 数字 系统 设计 的 全 过 程 ， 不 仅 涵盖 了 组 合 逻 辑 电 路 、 算 术 运 算 电 路 、 时 序 逻 辑 电 路 和 
同步 时 序 电 路 等 基本 的 数字 罗 辑 课程 的 内 容 ， 还 给 出 了 有 限 状态 机 、 流 水 线 、 接 口 规范 、 系 统 时 序 、 存 储 系统 等 计 
AAE rests 识 。 作 者 William J. Dally 曾 担任 斯 坦 福 大 学 计算 机 科学 系 主任 ， 他 不 仅 是 斯 坦 福 大 学 的 教授 ， 
是 英 伟 达 公司 的 首席 科学 家 ， 具 有 丰富 的 教学 经 验 和 杰出 的 工程 经 验 。 
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